python

92 items tagged with "python"

90 Articles

2 Diagrams

Articles

FastAPI Streaming Response: Error: Did not receive done or success response in stream

2024-07-03

Python Programming

Geoanalytics with geopandas and ABS Public Data in Python

2024-04-06

Python Programming

GenAI: Generate SQL from Text via Ollama Python Library on Local

2024-03-24

Python Programming

Danger: Bypass SSL Interception Proxy Server Certificate Validation in .NET or Python HTTP Requests

2024-01-05

.NET Programming

Pandas DataFrame aggregate a list column to a set

This code snippet shows you how to group a pandas DataFrame and then aggregate a column with list or array type to a set (with duplicates removed) or a list. To implement it, we can first expode the column (list type) and then use groupby to create a grouped DataFrame and then aggregate using set or list or a combination of both. Input `` category users 0 A [1, 2] 1 B [3, 4] 2 C [5, 6, 7] 3 A [1, 8, 1] 4 B [1, 6, 9] ` Output ` category usersset userslist 0 A {8, 1, 2} [8, 1, 2] 1 B {1, 3, 4, 6, 9} [1, 3, 4, 6, 9] 2 C {5, 6, 7} [5, 6, 7] ``

2023-08-10

Python Programming

Union two pandas DataFrame

This code snippet shows you how to union two pandas DataFrames in python using concat method in pandas namespace.If the schema is different, pandas will autmatically merge it. Output `` category value user 0 A 0 2.0 1 B 1 3.0 2 C 2 2.0 3 D 3 1.0 4 E 4 1.0 0 A 0 NaN 1 B 1 NaN 2 C 2 NaN 3 D 3 NaN 4 E 4 NaN ` For the second DataFrame, column user doesn't exist. Pandas uses NaN` to mark it.

python

Articles

FastAPI Streaming Response: Error: Did not receive done or success response in stream

Geoanalytics with geopandas and ABS Public Data in Python

GenAI: Generate SQL from Text via Ollama Python Library on Local

Danger: Bypass SSL Interception Proxy Server Certificate Validation in .NET or Python HTTP Requests

Pandas DataFrame aggregate a list column to a set

Union two pandas DataFrame

Pandas DataFrame groupBy and then COUNT DISTINCT

PySpark split and explode example

Azure App Service IIS Log Analytics using Pandas

Flatten Pandas DataFrame after Aggregate

Pandas DataFrame Group by one Column and Aggregate using MAX, MIN, MEAN and MEDIAN

Get First Top N Rows in a Pandas DataFrame

Check Column Data Types in a Pandas DataFrame

Python Convert Relative to Absolute File Path

Use sort() and orderBy() with PySpark DataFrame

PySpark DataFrame - Add or Subtract Milliseconds from Timestamp Column

Subscribe to Multiple Topics in Kafka Consumer

Kafka Consumer - Fetch Records from Beginning

Retrieve Kafka Messages (Records) via Timestamp

Convert Timestamp to Milliseconds since Epoch in Python

Python - Read Messages in Kafka Topic

Remove Special Characters from Column in PySpark DataFrame

PySpark DataFrame - Select Columns using select Function

Extract Value from XML Column in PySpark DataFrame

Python Format with Dictionary Object

Python: Read Data from MS Access Database via ODBC

PySpark - Read and Parse Apache Access Log Text Files

Pandas DataFrame - Get Row and Column Count

Install Miniconda and Anaconda on WSL 2 or Linux

PySpark - Read Data from MariaDB Database

PySpark - Read Data from Oracle Database

Pandas DataFrame - Iterate over Rows

Python: Read Data from Oracle Database

Connect to HBase in Python via HappyBase

Install Python 3.9.1 on WSL

Install Airflow on Windows via Windows Subsystem for Linux (WSL)

Torchvision error: Could not find module image.pyd

Create Environments with Different Python Versions in Anaconda

Call SQL Server Stored Procedure in Python

Read Email from Microsoft 365 via Microsoft Graph API

Spark - 保存DataFrame为Hive数据表

Spark (PySpark) - 从SQL Server数据库中读取数据

PySpark: 将DataFrame中的JSON字符列转换为数组

PySpark - 转换Python数组或串列为Spark DataFrame

Python: Send Email via Microsoft Graph API

Set Spark Python Versions via PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON

Load XML File into BigQuery

Spark - Read from BigQuery Table

Python: Read Data from BigQuery

Pandas - Save DataFrame to BigQuery

Load JSON File into BigQuery

Connect to PostgreSQL in Spark (PySpark)

Python: Load Data from MySQL

Python: Load Data from Hive

Load Microsoft 365 SharePoint List Data in Python

Read and Write XML Files with Python

Kafka Topic Partitions Walkthrough via Python

Apache Kafka Python Producer and Consumer Clients Introduction

Python: Save Pandas DataFrame to Teradata

Python: Load / Read Multiline CSV File

Create, Insert, Delete, Update Operations on Teradata via JDBC in Python

Python: Read Data from SQLite via JDBC

Data Operations with SQLite Database via Python

AttributeError: type object 'java.sql.Types' has no attribute '__javaclass__'

Pandas DataFrame Plot - Scatter and Hexbin Chart

Pandas DataFrame Plot - Area Chart

Pandas DataFrame Plot - Pie Chart

Convert String to Date using Python

Pandas DataFrame Plot - Line Chart

Pandas DataFrame Plot - Bar Chart

PySpark Read Multiline (Multiple Lines) from CSV File

Connect to SQL Server via JayDeBeApi in Python

PySpark: Convert Python Dictionary List to Spark DataFrame

Create and Read Pickle Files in Python

Convert Python Dictionary List to PySpark DataFrame

Read JSON file as Spark DataFrame in Python / Spark

Write and read parquet files in Python / Spark

Convert string to date in Python / Spark

AttributeError: type object 'java.sql.Types' has no attribute 'javaclass'