对于列中的每个元素,返回基于其他数据帧的匹配列的Pandas数据帧的子集/切片?
Return subset/slice of Pandas dataframe based on matching column of other dataframe, for each element in column?

所以我认为这是一个相对简单的问题:我有一个Pandas数据框(A),它有一个关键列(不是唯一的/将有重复的密钥)我有另一个Pandas数据框(B)有.. 。

如何按类标签或任何特定列对Pandas数据框进行排序/分组
How to sort/ group a Pandas data frame by class label or any specific column

class col2 col3 col4 col5 1 4 5 5 5 4 4 4.5 5.5 6 1 3.5 5 6 4.5 3 3 4 4 4 2 3 3.5 3.8 6.1我在示例中使用了假设数据。 ......

根据观察分位数分配指标
Assigning indicators based on observation quantile

我正在使用pandas DataFrame。 我想在满足特定条件时将列指示符变量赋值为1。 我计算特定组的分位数。 如果价值超出......

按日期时间进行索引pandas数据帧失败
Indexing by datetime pandas dataframe fail

我有以下数据帧df:Candy Apple Banana 2016-09-14 19:00:00 109.202060 121.194138 130.372082 2016-09-14 20:00:00 109.199083 121.188817 130 ....

使用unname删除data.frame的dimnames不起作用
remove dimnames of data.frame using unname doesn't work

我试图删除data.frame的rownames和colnames。 正如Jason所说,这可以通过unname完成,然后将rownames设置为NULL。 我注意到手册说使用带有选项force = T的unname ...

Python循环通过Dataframe'Series'对象没有属性
Python loop through Dataframe 'Series' object has no attribute

使用pandas版本0.19.0,我有一个带有编译正则表达式的数据框。 我想遍历数据帧并查看是否有任何正则表达式与值匹配。 我能做到......

如何根据另一个数据框中的条件创建新数据框
How to create a new data frame based on conditions from another data frame

刚进入Python,所以希望我不会在这里问一个愚蠢的问题......所以我有一个名为“df_complete”的pandas数据框,让我们说100行,并包含名为“type”,“writer”的列......

尝试将DataFrames与许多条件合并
Trying to merge DataFrames with many conditions

这是一个奇怪的问题:我有3个数据框,“prov_data”包含一个提供者ID,并依赖于区域和类别(即,提供者与这些区域和类别进行了多少次交互)。 ...

R匹配数据帧的不同行中的字符串[重复]
R match strings in different rows of a dataframe

我有一个包含条件列和值的数据框,我有一个只有条件的数据框,我想通过匹配条件来提取它们的值。 df1:名称样式......

Pandas Dataframes:比较两个相邻行的值并添加一列
Pandas Dataframes: comparing values of two adjacent rows and adding a column

我有一个pandas Dataframe,我必须比较特定列的两个相邻行的值,如果它们相等,则在新列中需要在相应的第一行或1中添加0 ...

pandas数据帧中的可变移位
Variable shift in a pandas dataframe

将pandas导入pd df = pd.DataFrame({'A':[3,5,3,4,2,3,2,3,4,3,2,2,2,3],'B':[ 10,20,30,40,20,30,40,10,20,30,15,60,20,15]})AB 0 3 10 1 5 20 2 3 30 3 4 40 4 2 ...

从列中提取值的一部分
Extract a part of values from a column

我有一个数据帧df,它有一个名为“Results”的列。 那些列的值类似于 - 结果电影通过3次测试中的1次电影通过3次测试中的2次电影通过3次测试中的3次<空...

如何从数据框中检索行名和列名?
How to retrieve row and column names from data frame?

我使用pandas.corr从数据框生成了一个相关矩阵:cmat = sub1.corr()cmat Out [75]:CESI001 CESI002 CESI003 CESI004 CESI001 1.000000 0.829723 0.046925 0 ....

R - 将数据帧转换为矩阵,使用head()时获得不同的结果
R - converting data frame to matrix, get different results when using head()

我有一个大约78,000行的数据框,如下所示:EmailAddress Column1 Column2 Column3 abc1@gmail.com 1 0 0 abc2@gmail.com 0 0 0 abc3@gmail.com ...

根据现有列中的bool值向pandas数据帧添加列
Adding a column to pandas dataframe based on bool values in existing column

我有一个pandas数据框,我想添加一个新列。 新列值将由包含bools的数据框中的现有列确定。 下面的代码是我的C ++ ...

dataframe创建整数julia的新列
dataframe create new column of integer julia

我正在尝试使用另一个整数Z列和一个Array类型为Array {Float64,1}的数组X,将新列Y添加到Float64类型的数据框中。 当我运行命令时:df [:Y] = map(z-> X [z],df [:Z])...

具有重叠间隔时间序列的groupby
groupby with overlapping intervals timeseries

我在python pandas dataframe对象中有一个时间序列,我想基于索引创建一个组,但我想要重叠的组,即组不是不同的。 header_sec是索引列。 每个......

Python Pandas - Json到DataFrame
Python Pandas - Json to DataFrame

我有一个复杂的Json文件,如下所示:{“User A”:{“Obj1”:{“key1”:“val1”,“key2”:“val2”,“key3”:“val3”,}“Obj2 “:{”key1“:”...

在连续变量边界处拆分数据帧并在两侧执行计算
Splitting a data frame at a continuous variable boundary and performing a computation on both sides

我试图基于给定变量的边界值来分割数据帧,在边界的两侧计算某些东西并输出矩阵(最好是数据帧)。 示例代码如下:...

Julia DataFrame使用LOCF填充NA
Julia DataFrame Fill NA with LOCF

有没有快速的方法将DataFrame的NA值转换为最后观察到的值? 使用DataFrames d = @data [1,NA,5,NA,NA] df = DataFrame(d = d)result = filled_with_locf(df)expected = [1,1,5,5,...

如何拆分数据框,在每个列表数据框中创建新变量,以及拆分?
How to split dataframe, create new variable in each list dataframe, and unsplit?

我试图拆分数据帧,在每个数据帧列表对象中创建一个新变量,并重新组装(unsplit)原始数据帧。 我试图创建的新变量对变量B.2进行缩放...

按id匹配并在两个数据帧之间划分列值
Match by id and divide column values across two dataframes

frames:df 1:包含多个具有500个列值的相同id的行id | val.1 | val.2 | ... | val.500 ----------------- ---------------- 1 | 240 | 234 | ... | 228 1 | 224 | 222 | ... | 230 ......

将日期时间字符串转换为pandas数据框中的Day,Month,Year的新列
Convert datetime string to new columns of Day, Month, Year in pandas data frame

我是python的新手,有一个非常简单(希望直截了当!)的问题。 假设我有一个包含3列的数据框:time(格式为YYYY-MM-DDTHH:MM:SSZ),device_id和......

具有标识符向量的子集特定行 - 警告消息
Subset specific rows with vector of identifiers - warning messages

我想用标识符向量对特定行进行子集化。 这是我的数据数据= rbind(c('B11008Z','男','13'),c('B11040Z','女性','14'),c('B11040E','女性','12 '))colnames(...

Pandas - 使用to_hdf将文件大小加倍,添加具有相同名称的数据帧
Pandas - Adding dataframe with same name using to_hdf doubled file size

我是Pandas模块的新手。 我使用to_hdf创建了数据框并使用名称“dirtree”保存它:df.to_hdf(“d:/ datatree full.h5”,“dirtree”)我重复了上面的操作。 之后,当我检查文件时......

在Pandas中,如何将“长”表转换为“宽而稀疏”的表?
In Pandas, how can I convert a "long" table to a "wide and sparse" table?

我的术语太可怕了,所以这个值得一些解释。 想象一下,我有一个这样的DataFrame(我称之为“长”表):时间股价--------------------------- 13 :...

当某些列是datetime.time类型时,如何按列名对df进行切片?
How to slice df by col name when some of the columns are of datetime.time type?

给定这种类型的df:A = pd.DataFrame([[1,5,2,8,2],[2,4,4,20,2],[3,3,1,20,2], [4,2,2,1,0],[5,1,4,-5,-4],[1,5,2,2,-20],[2,4,4,3,0] ,[3,3,1,-1,-1],[4,...

传递列名时数据框为空
Dataframe empty when passing column names

我面临的问题是,在没有列名的情况下将numpy数组传递给dataframe正确地初始化它。 然而,如果我传递列名,则它是空的。 x = np.array([(1,'1'),(2,'2')],dtype ='i4,...

如何在python pandas中检查列内容的dtype?
How can I check the dtype of the contents of a column in python pandas?

这个问题与如何在python pandas中检查列的dtype有关。 创建一个空的pandas数据帧。 在此之后,它充满了数据。 我怎么能检查它是否有任何......

保留一个元素的快速计算均值
Fast calculation of mean with leaving one element out

让我们假设我有一个数据帧df = pd.DataFrame(data = {'group_id':[1,1,1,1,2,2,2,2],'A':[24.0,12.0,23.0,22.0, 44.0,55.0,52.0,48.0],'B':[23.0,15.0,22.0,21.0,65.0,53.0,......

根据其他列(python)中的分类值创建新的pandas列
Create new pandas column based on categorical values in other column (python)

我有一个包含国家和交通列的数据框:国家/地区 交通US 8687意大利902834德国2343巴西4254法国23453我想加上......

使用Datashader绘制NumPy数组数据的最佳方法是什么?
What is the best method for using Datashader to plot data from a NumPy array?

在跟随Datashader示例笔记本演示行时,输入是一个Pandas DataFrame(虽然看起来Dask DataFrame也可以工作)。 我的数据是在NumPy数组中。 我可以用吗 ...

如何填写我的数据框
How can I fill my dataframe

有人可以告诉我如何填写数据框的缺失值吗? 缺少的值不会出现为NaN或任何常见的东西而是显示为两个点,如...我将如何...

Dataframe group,获取相应的行值,基于聚合函数的结果[重复]
Dataframe groupBy, get corresponding rows value, based on result of aggregate function

我有数据框,列名为c1,c2,c3,c4。 我想将它分组在一个列上,并在其他列上使用agg函数,例如min / max / agg ..等,并根据...获取相应的其他列值

重新排序具有重复ID的数据框
Reorder a data frame with duplicated id

我有一个名为df的元素:样品核素强度SRM1 Pb206 200 SRM1 Pb207 250 SRM1 Pb208 301 SRM1 Pb206 202 SRM1 Pb207 254 SRM1 Pb208 305 SAM1 ...

在pandas数据框中插入一行而无需更改为Python中的列表
Insert a row in a pandas dataframe without changing to a list in Python

如何在不将其转换为列表的情况下插入与位置1和2之间的数据帧具有相同参数的变量? 我试过df =(df.ix [:1],foo,df.ix [2:])但是类型(df)返回列表,...

使用Pandas以更有效的方式在后续行之间应用函数
Apply function between subsequent rows in more efficient way with Pandas

我有一个数据帧df定义如下:import numpy as np import pandas as pd dic = {'A':['1A','1A','3C','3C','3C','7M' , '7M', '7M'], 'B':[10,15,49,75,35,33,45,65], 'C':[11,56,32,78,45,89,15 ,14],“...

两个熊猫数据框的分组条形图
Grouped bar chart from two pandas data frames

我有两个包含不同值但结构相同的数据框:df1 = 0 1 2 3 4 D 0.003073 0.014888 0.155815 0.826224 NaN E 0.000568 ...

迭代pandas中的列并更改单元格的值 - Python
iterate of column in pandas and change value of cells - Python

我有一个名为'postcodes'的列的df。 这些邮政编码之间有空格。 有没有办法改变这些细胞的价值(最好不必制作新的csv),以便它们......

操作数值或用nan替换单元格
Either operating on a numeric value or replacing cell with nan

在pandas.DataFrame df中,假设我有一个列E.如果E包含一个整数或浮点数,我想用10 ^ 6 * E替换它。但是如果E包含非数字字符或者只是......

如何在不重复函数调用的情况下为data.frame分配多个列
How to assign multiple columns to data.frame without repeating function call

为什么这不适用于一个例子? 每行都有相同的值,警告以及数据< - data.frame(id = 1:10)slowCall < - function(id)data.frame(b = rep(id,3),c = runif(3))数据[C(” ...

子集大数据帧
Subsetting large data frames

是否有一种快速而聪明的方式,比如DF这样的vec < - data.frame(名称= c(“var1”,“var2”,“var3”,“var4”,“var5”,“var6”) ,“var7”,“var8”,“var9”,“......

在Python中访问数据帧的不同方式的性能
Performances for different ways of accessing dataframes in Python

我只是研究Python Pandas数据框,我看到了%timeit然后我比较了一些Dataframe,下面是一个表现的例子,用于访问高度相关的数据帧的不同方式......

基于另一个系列的熊猫高效分组
Efficient grouping in pandas based on another Series

我需要改变基于我的DataFrame中另一个布尔列的分组操作。 在一个例子中最容易看到:我有以下DataFrame:b id 0 False ...

在R中:具有混合数据类型的数据帧的类型转换
In R: Type conversion of data frames with mixed data types

我一般都喜欢R,但类型转换问题让我发疯。 以下问题:我从数据库连接中读取数据帧。 结果是具有字符列的数据框。 我知道 ...

如何使用pandas groupby和aggregate生成新列?
How do I generate new columns using pandas groupby & aggregate?

我有一个运行的DataFrame:df.groupby(by =“mycol”)。agg({“colA”:“sum”,“colB”:“count”})但是,colA和colB需要存在。 从...创建新列的最“熊猫”方法是什么?

使用整数列表/元组替换Pandas DataFrame列中的值
Replace values in Pandas DataFrame column with integer lists / tuples

我想将包含国际象棋方形坐标的3列pandas数据帧df替换为字符串,使用字典chess_dict以2x1整数列表的形式将它们映射到笛卡尔坐标....

根据列值对具有MultiIndex的pandas DataFrame进行排序
Sort pandas DataFrame with MultiIndex according to column value

在控制台中打印后,我有一个MultiIndex的DataFrame看起来像这样:value indA indB scenarioId group 2015-04-13 1 ...

从对象内部的方法输出Python pandas数据帧的表格式
Outputting table format for Python pandas data frame from inside method inside object

我在Anaconda分发的Jupyter / IPython笔记本上安装了Python 2.7。 如果一个pandas数据帧是编码单元格中的最后一个东西,它输出一个漂亮的干净表格式(单元格是...
1 2 3 4 5 6 7 166 167