从Pandas中的count方法访问数据
Accessing data from a count method in Pandas

我使用count方法从DataFrame返回信息:df = pd.DataFrame.from_csv(csv_file)for d in df ['OPTION']。unique():count = df.loc [df ['OPTION'] == i] .count打印...

Python多处理TypeError
Python multiprocessing TypeError

我有一些像这样的代码。 当我做作业时遇到错误[i] .get()这是一个multiprocessing.pool.ApplyResult对象TypeError:'Series'对象不可调用import multiprocessing ...

pandas两个数据帧,某种合并
pandas two dataframes, some sort of merge

我有两个这样的数据帧:df ['one'] = [1,2,3,4,5] df ['two'] = [nan,15,nan,22,nan]我需要某种连接或者合并将给我这样的数据帧:df ['result'] = [1,15,3,22,5] ...

当索引不对齐时,pandas DataFrame更新/组合
pandas DataFrame update/combine when indices don't align

考虑两个数据帧,它们存储相同观察的相同特征的信息,但是对于不同的时间段:导入pandas为pd import numpy as np df1 = pd.DataFrame({“obs”:[“...

有没有办法将两个(或更多)数据帧写入一个Excel电子表格?
Is there a way to write two (or more) dataframes to one excel spreadsheet?

如果我可以使用pandas和xlsxwriter以一种方式堆叠两个数据帧,一个在另一个上面,在同一个...上,它将帮助我产生更整洁的输出和更像“人类”的输出。

从DataFrame,Pandas,Python创建字典
Dictionary Creation from DataFrame, Pandas, Python

我想创建一个字典,其中键是状态名称,值是与状态对应的所有计数的总和。 dataFrame中的示例State Count California 100 ...

将函数应用于DataFrame GroupBy并返回较少的列
apply function to a DataFrame GroupBy and return fewer columns

我想对我的DataFrame进行分组,然后应用几个返回单个结果的列的函数。 在[25]中:length = 100 In [26]:rnd = np.random.random在[27]中:df = pd.DataFrame(dict(group = np ....

如何在Python中合并两个pandas DataFrame?
How to merge two pandas DataFrames in Python?

我正在尝试使用内部联接加入两个pandas数据框。 my_df = pd.merge(df1,df2,how ='inner',left_on = ['date'],right_on = ['myDate'])但是我收到以下错误:...

复杂的日期时间合并熊猫
Complicated datetime merge pandas

假设我有以下数据导入numpy作为np import pandas as pd import datetime table = [[datetime.datetime(2015,1,1),1],[datetime.datetime(2015,1,27),1], [...

打开损坏的PyTables HDF5文件
Opening a corrupted PyTables HDF5 file

我希望在打开损坏的HDF5文件时提供一些帮助。 我通过Pandas访问PyTables,但pd.read_hdf()调用会产生以下错误。 我对......的内部运作一无所知

对熊猫数据帧的矢量化操作
Vectorized operation on pandas dataframe

我目前有以下代码遍历数据帧的每一行,并将某个单元格的先前行值分配给不同单元格的当前行。 基本上我正在做的是......

火花数据帧是否像熊猫一样有每行的“行名”?
Does spark dataframe have a "row name" for each row like pandas?

我正在尝试使用Spark DataFrames来操作两个按行名索引的DataFrame。 在pandas中,我们可以做df.loc(['aIndex','anotherIndex'])来通过索引(或者...的名称)在df中选择两行。

根据数据框中的列切片数据
Slicing data based on column in dataframe

我有这样的DataFrame:月日TmaxF 4 1 1912 56.00 4 2 1912 56.00 4 3 1912 74.00 1 1 1913 38 1 2 1913 28 1 3 1913 ...

Concat同一系列多次?
Concat the same series a bunch of times?

让我们说我有一系列的导入大熊猫pd a = pd.Series([1,2,3])有没有比chamillion_row_df = pd.concat([a] * 1000000创建百万行df更有效的方法)?

pandas数据帧的累积唯一元素数
cumulative number of unique elements for pandas dataframe

我有一个pandas数据帧id标签1 A 1 A 1 B 1 C 1 A 2 B 2 C 2 BI想要添加一列来计算id级别的唯一标签累积数量。 更具体地说,我会......

使用np.array值创建包含字典列表的DataFrame
Creating DataFrame with list of dictionaries with np.array values

我有一个字典列表,其值作为numpy数组返回(通常为空)。 data = [{'width':array([])},{'width':array([])},{'width':array([])},{'...

使用Numpy Array,元组和省略号进行布尔索引
Boolean indexing with Numpy Array, tuples and Ellipsis

我理解Numpy数组布尔索引概念的整数在[95]中:a = np.array([1,2,3,2,1,2])在[96]中:a == 1 Out [96]:array( [真,假,假,假,真,假],dtype = bool [97]:......

如何将normalize函数应用于pandas字符串系列?
how do I apply normalize function to pandas string series?

我想将以下函数应用于数据帧系列:unicodedata.normalize('NFKD',c.lower()。decode('utf-8'))。encode('ascii','ignore')I(sort我明白我怎么能做......

为什么Pandas Panel搞砸了轴顺序?
Why does Pandas Panel have messed up axes order?

在Pandas Panel中,轴顺序似乎真的让我感到不安。 为什么会这样? 这就是我的意思:在[120]中:将pandas导入为pd在[121]中:将numpy导入为np在[122]中:pnl = pd.Panel(np.random ....

Pandas DataFrame到Numpy数组ValueError
Pandas DataFrame to Numpy Array ValueError

我试图将数据帧的单个列转换为numpy数组。 转换整个数据帧没有问题。 df即a1_count a1_mean a1_std 0 0 3 2 0.816497 1 ...

用Python替换数据框中的值
Replacing values in a data frame in Python

我是python的新手,并试图学习如何使用它进行数据分析。 我在python中有一个数据框(称为“数据”)。 我想重新编码一个变量GEND,它有三个值(1,2,3)。 用...

使用Python和Pandas(AWK)重新格式化CSV文件?
Reformat CSV file using Python and Pandas, (AWK)?

我有一个CSV文件,如下所示:名称,大小,状态,时间1,时间2,S1,22,MD,0.022,,523.324 S2,22,MD,4.32,342.54 S3,22,MD,3.54,,0.32 S4,......

Pandas开发工作流程:conda和构建C扩展
Pandas development workflow: conda and building C extensions

我正在为Pandas核心编写一些代码,我想知道我的工作流程是否正确。 由于Travis CI实例针对不同版本的Python进行测试,我设置了conda来切换...

附加到Pandas中的DataFrame作为新列
Append to a DataFrame in Pandas as new column

我有两个具有相同索引的DataFrame,并希望将第二个附加到第一个。 假设我有:df1 = pd.DataFrame([1,2,3],index = [2,3,4])df2 = pd.DataFrame([3,5,3],index = [2,3, 4])df1 ......

按时间段迭代数据帧块
Iterate over chunks of dataframe by time period

我有一个由时间索引的熊猫数据帧>>> df ABCD 2000-01-03 1.991135 0.045306 -0.657898 0.311375 2000-01-04 0.690848 1.862244 0 ....

从事件数据创建时间序列DataFrame
Creating time series DataFrame from event data

我有一个商店位置的数据集,其中包含事件日期(所有库存从该商店出售的日期)和已售商品的数量,例如以下内容:import numpy as np,pandas as pd#...

使用sklearn对单变量时间序列进行聚类
Clustering uni-variate Time series using sklearn

我有一个熊猫DataFrame,我想为每个列做集群。 我正在使用sklearn,这就是我所拥有的:data = pd.read_csv(“data.csv”)data = pd.DataFrame(data)data = data ....

向Series添加元素的问题
Issue with adding elements to Series

我正在努力填写系列剧集。 print(l.get_results())返回系列,就像我预期的那样,但是,print(系列)返回一个空系列,我不知道怎么追加...

Pandas groupby并描述标志AttributeError
Pandas groupby and describe flags AttributeError

我有一堆存储在vals中的数据。 指数是单调的,但不是连续的。 我正在尝试对数据的直方图进行一些分析,所以我创建了以下结构:hist = pd ....

在SQL Alchemy中创建交叉选项卡查询
Creating a Cross Tab Query in SQL Alchemy

我正在谷歌和sqlalchmey文档上做一些阅读,但找不到任何类型的内置功能,可以采取标准的续集格式表,并将其转换为交叉...

熊猫加速加速
Speedup of pandas groupby

我在高性能计算中使用pandas DataFrame。 这个函数是一个重要的时间汇:def calculate_with_n_electron(self,phi,partition_function,...

关于pandasql locals()和globals()方法的问题
about pandasql locals() and globals() method issue

对于pandasql包的sqldf方法,有一个“会话/环境变量”,可能是locals()或globals(),谁能让我知道它是为了什么? 任何文件参考我们何时应该使用......

TypeError:当时间序列mungling时,无法连接非NDFrame对象
TypeError: cannot concatenate a non-NDFrame object, when time series mungling

有一个时间序列ts(dataframe.to_dict()){'latitude':{Timestamp('2014-10-20 15:21:56.571000'):48.145553900000003,Timestamp('2014-10-20 15:24:00.789000' ):48.145584300000003,时间戳('2014 -...

如何计算DataFrame对象中的类别数?
How to count number of categories in DataFrame object?

假设我们有一个包含多个框的DataFrame对象。 每个盒子里面都有“Apple”,“Banana”或“Peach”内的水果。 如何计算有多少盒子里面装有'Apple'或'Bananas'或'Peach'?

熊猫一天一天
Pandas day for day

我在Pandas数据帧中有很多数据:时间戳值2015-07-15 07:16:39.034 49.960 2015-07-15 07:16:39.036 49.940 ...... 2015-08-12 23:16: 39.235 42.958我有......

使用pandas:如果在一行中,列中的单词不会出现在其他列的字符串中,则删除行
With pandas: if, in a row, a word in a column does not occur in string in other column, drop row

假设我们有这个数据帧:来自pandas import * d = {'one':Series([“word”,“other-word”,“banana”,“hello”]),'two':Series([“I喜欢那个单词“,”你看过其他单词“,”你呢......

pandas groupby在多列中连接字符串
pandas groupby concatenate strings in multiple columns

我有这个pandas数据框:df = DataFrame({'id':['a','b','b','b','c','c'],'category':['z' ,'z','x','y','y','y'],'category2':['1','2','2','2','1','2' ]})看起来像:category category2 ...

将字典字典转换为pandas数据框
Converting dictionary of dictionary of dictionary to pandas data frame

我有以下嵌套字典:在[3]中:nested_dict Out [3]:{'2':{'lagtime':{'darkgreen':210,'darkorange':141,'pink':142,'red' :141}}}我想做的是创建一个数据......

Pandas - 其他每个值的列的最小值
Pandas - min of a column for each value in other

我有一个CSV文件如下:日期,名称2015-01-01 16:30:00.0,John 2015-02-11 16:30:00.0,Doe 2015-03-01 16:30:00.0,Sam 2015-03 -05 16:30:00.0,山姆2015-04-21 16:30:00.0,Chris 2015-05-07 16:30:00 ....

熊猫:使功能图部分Dict匹配
Pandas: Make function map partial Dict match

此函数查看pandas DataFrame中的字符串。 如果字符串包含与字典中的条目匹配的正则表达式,则它将捕获的字符串传递给函数的其他部分...

从pandas索引中按标签选择项目[重复]
Selecting Items by label from a pandas index

假设我有一个Pandas Index对象。 我想在索引中找到项目的整数索引。 例如:index = pd.Index(['a','b','c'])print np.argmax(index =='b')>>> 2 ...

如何在Python中使用Pandas数据结构附加多个CSV文件
How do I append multiple CSV files using Pandas data structures in Python

我有大约10个CSV文件,我想将其附加到一个文件中。 我的想法是将文件名分配给编号的data_files,然后将它们附加到while循环中,但是我无法更新...

在pandas dataframe中以逗号分隔的字符串中的每个项目添加+1
Add +1 to each item in a comma-separated string in pandas dataframe

我有一个pandas数据帧结构如下:| ID | 开始| 停止| ________________________________________ | 1 | 1,2,3,4 | 5,6,7,7 | | 2 | 100,101 | ...

在python中使用的最佳数据结构,用于存储命名数据的三维立方体
Best data structure to use in python to store a 3 dimensional cube of named data

我想对我选择的数据结构做一些反馈。 我有一个特定电压值的2D XY栅格电流值。 我有几个电压步骤,并将数据组织成一个多维数据集......

`pandas to_json`和`read_json`之间存在大的文件大小差异
large filesize difference between `pandas to_json` and `read_json`

设置这个问题的基础是我正在使用celery和rabbitmq创建一个分布式HDFStore消息传递应用程序,它将pandas DataFrame传递给分布式进程(然后写...

在pandas数据帧中高效存储大字符串列
Efficient storage of large string column in pandas dataframe

我有一个大型的pandas数据帧,其字符串列的字符串大小严重偏斜。 大多数行都有长度<20的字符串,但有些行的字符串长度更多......

在熊猫中嵌套的ifelse替代品
Nested ifelse alternative in pandas

假设我们有一个测试数据集:值组123 1 120 1 NA 1 130 1 23 2 22 2 24 2 NA 2现在我们要用分组中值替换缺失值。 在R中我们可以使用嵌套的...

事件之间的时间(熊猫)
Time between events (pandas)

我想找到2个事件A和B之间经过的时间。更具体地说,每当事件A发生时,我想知道在事件B的下一次出现之前需要多长时间。看看这个......

重新采样Pandas时间序列数据,每行只保留有效数字
Resampling Pandas time series data with keeping only valid numbers for each row

我有一个数据框,其中包含一个网页列表,其中每小时的时间由unix小时计算。 透视,它看起来像这样:+ ----------- + -------- + -------- + -------- + --- ----- + -------- + -------- + -------- + ---...
1 2 3 4 5 6 7 583 584