R - 在“主键列”上将数据帧中的行附加到另一个没有重复的行
R - Append rows from dataframe to another one without duplicate on "primary keys columns"

我必须使用数据帧(A和B)。 B包含新值,A包含过时值。 这些数据帧中的每一个都有一列代表键,另一列代表值。 我想要 ...

将Pandas DataFrame保存为PDF文件格式,无需pdfkit
Saving Pandas DataFrame into PDF File format without pdfkit

我想将pandas数据帧保存为pdf格式。 import pdfkit as pdf config = pdf.configuration(wkhtmltopdf =“C:\ Program Files \ wkhtmltopdin \ wkhtmltopdf.exe”)pdf.from_url('http://google.com'...

使用pandas进行高效的成对计算
Efficient pairwise calculations with pandas

给定一些分类数据行,我想计算一个成对矩阵,其中包含这些行之间的差异数。 例如,将具有值[1,0,0,1]的行与具有...的行进行比较

R中的逻辑索引失败
Logical indexing failure in R

我已尝试使用内置数据集重现此问题,但它只发生在我自己的数据集中。 如果我们采用我的数据的随机子集:结构(列表(ID =结构(c(27L,1L,27L,7L,5L,10L,23L,......

read_csv使用dtypes但列中有na值
read_csv using dtypes but there is na value in columns

我使用以下代码来读取csv,通过指定每个col的类型:clean_pdf_type = pd.read_csv('table_updated.csv',usecols = col_names,dtype = col_types)但它有错误:ValueError:...

使用!=运算符在Python中删除行不起作用
Dropping rows in Python using != operator is not working

我想使用以下方法删除数据集中的行:totes = df3.loc [(df3 ['Reporting Date']!= '18 / 08/2017')&(df3 ['Business Line']!='Bondy')]然而,这不是我所期望的; 我知道...的数量

将一列替换为属于两个不同数据帧的另一列的值
replace one column with values of another column belonging to two different data frames

我有两个数据框如下:导入pandas为pd d = {'PART_NO':['J661-03982','661-08913','922-8972','661-00352','661-06291'] ,'PART_NO_ENCODED':[541,1273,1110,1575,295]} suggest = pd ....

熊猫插入
Pandas Interpolate

╔═════════════╗║col1║col2║╠══════════════╣║2║NaN║║4║5║║12║11║ ║23║23║║NaN║23║║NaN║23║║NaN║NaN║║NaN║NaN║║NaN║NaN║║NaN║...

Spark数据帧用Null替换行中特定列的值
Spark dataframe replace values of specific columns in a row with Nulls

尝试用空值替换Spark数据帧的特定列的值时,我遇到了问题。 我有一个包含超过五十列的数据框,其中两列是关键列。 我想要 ...

在数据框内交换列的内容
Swap contents of columns inside dataframe

我有一个带有这个内容的pandas dataframe df; Column1 Column2 Column3 C11 C21 C31 C12 C22 C32 C13 C23 C33我想交换内容......

如何压缩数据帧
How to Zip Dataframe

我想压缩pandas的数据框并使其成为一个列表。 list(zip(dataframe ['a'],dataframe ['b'],dataframe ['c'],dataframe ['d'],dataframe ['e'],dataframe ['f'])这是最后的...

处理数据类型对象的dataframe列的缺失数据
Handle missing data for a dataframe column of datatype object

我有一个pandas数据帧,其中一个列是datatype对象。 此列中存在空白元素,因此我尝试使用df检查此列中是否还有其他空元素[...

熊猫:价值按多列组计算
Pandas: Value counts by multi-column groupby

我有一个Pandas数据框,我按两列分组:ID和Item。 然后我保持每组中的最后5次出现(最大),并且最终想要计算...的数量的比率...

传播data.frame并添加列
Spreading a data.frame and adding columns

我有这个data.frame格式(由lm汇总矩阵产生):set.seed(1)df < - data.frame(effect = rnorm(3),effect_se = runif(3,0,0.2),effect_p.value = runif(3,0,1),factor_name = paste0(...

python:如何拆分列并将最大元素添加到新列?
python: how to split a column and add the maximum element to a new column?

我想分割一个数据帧的列,并将maximun值添加到新列。 导入pandas为pd import numpy as np df = pd.DataFrame({'a':['1,2',3,-1,'8,9,1']})输出:a 0 1,2 1。 ..

替换DataFrame中的值
Replacing Values in DataFrame

所以一个快速的问题跳出这一个....快速替换R中的数据框中的值如果我想做这个替换但只对我的数据框的某些行,有没有办法添加一行...

将json列表转换为数据框
Convert json list to data frame

我在将json文件转换为数据框时遇到问题。 我使用jsonlite和fromJSON()函数以及unlist()函数,但我无法在我想要的数据模型中获取数据。 Json文件......

使用panda在python 3.7中转换数据帧
Transforming dataframe in python 3.7 with panda

我有使用python 3.7的以下数据框架。 我使用的数据框是来自熊猫库比特币High Low Close Date ...

映射到Deedle Frame
Map to Deedle Frame

我正在学习F#。 我试图将Map <string,seq <DateTime * float >>转换为Deedle数据帧(http://bluemountaincapital.github.io/Deedle/tutorial.html#creating)。 我已经过了......

在R中透视数据帧
Pivoting a Dataframe in R

假设给出了一个包含多个列的数据帧,这些列是因子和感兴趣的列colA。 例如,假设数据框如下所示:colA | colB | colC | colD ----------...

转换为宽格式,同时在R中保留一些列[重复]
Convert to wide format while keeping some columns in R

我有这样一个表:类型,ID,名称,时间a,1,abc,2017-01-01 00:00:00 b,1,abc,2017-01-01 00:01:00 a,1, abc,2017-01-01 00:02:00 b,1,abc,2017-01-01 00:03:00而我正在尝试转换...

Python dtype('O')。
Python dtype('O') . Processing object data type. Converting to string/integer

我有来自ImDB的演员表。 从这个表我想删除imdb_actors.birthYear缺失或小于1950的所有行,并且还删除imdb_actors.deathYear有一些...

从两个向量中删除相同的索引
Remove same indices from two vectors

我在R中有两个向量,例如< - c(2,6,4,9,8)b < - c(8,9,4,2,1)向量a和b以我希望的方式排序保存(我将彼此密谋)。 我想删除......

基于列将Dataframe与Series合并
Merging Dataframe with Series based on column

我有一只熊猫系列S:日期2/27/2017 149 2/28/2017 150 3/01/2017 154 3/04/2017 152 3/12/2017 156 3/17/2017 148我也有一个Dataframe df日期ABC ...

使用其他数据帧和系列快速替换pandas数据帧的信息
Quickly replacing information of a pandas dataframe using other dataframe and series

我目前正在尝试使用另一个数据帧和一系列数据替换数据帧的信息以进行模拟分析。 玩具示例如下:A是用户信息数据帧,B是服务...

根据公共列合并多个数据帧
Merge multiple dataframes based on a common column

我有三个数据帧。 所有这些都有一个共同的列,我需要根据公共列合并它们而不丢失任何数据输入>>> df1 0 Col1 Col2 Col3 1 data1 3 4 2 data2 4 ...

如何标记编码数据集表中的列索引?
How to label encode the column index in the data-set table?

我正在尝试标记编码第二列我收到错误。 我究竟做错了什么? 我能够编码第一列data.head()area_type可用位置大小...

在pandas中应用group by后获取最大计数的行值
Get row value of maximum count after applying group by in pandas

我有以下df>在[260]:df> Out [260]:大小市场蔬菜确认可用性0大ABC番茄NaN 1大XYZ番茄NaN ...

以年增长率生成未来数据框架
Generating future dataframe with annual growth rate

当我有基准年和增长率的数据时,我正在尝试生成某个产品的年度数据。 在玩具示例中,每个产品的效率都有不同的年增长率......

请参阅多索引pandas数据帧中的pandas系列值
Refer to a pandas series value from a multi-index pandas dataframe

我有以下pandas.core.series.Series:Color Red 4 Green 7和以下multiindex数据帧。 我的目标是通过将Value除以...来在数据框中创建Target列。

在R中循环以查找上一个匹配项
Loop in R to find previous match

我需要一些帮助来在R中编写一个循环函数。当出现相同的id然后写入OLD_RANK列和NEW_RANK列时,选择上一个匹配有一些问题。 OLD_RANK必须是...的NEW_RANK

pandas可以选择一些数据或所有数据特定的列,并通过使用Python 2.7的pandas平均每5行?
Can pandas select some data or all data specific column and average every 5 rows by using pandas with Python 2.7?

我想计算特定列中每5行的平均值或标准值,并使用python 2.7的pandas从另一列中选择数据(第一个或最后一个或全部或我选择的一些数据)...

用户在Python中定义了croston函数
User defined croston function in Python

我想预测间歇性需求值。 为此,我想要以下输出:1。非零元素值(q)2。两个非零元素之间的到达间隔时间(a)例如,我的数据......

Python / Pandas:通过DataFrame索引中的唯一日期时间来获取不同的时间
Python/Pandas: Want Different Times of Day to by Unique DateTimes in DataFrame Index

我有一个csv文件pruned_results.txt看起来像这样:2018-08-01 08:41:08,等待OK测量2018-08-01 09:02:26,等待OK测量2018-08-01 10:49:06,等待OK 2018-08 -...

更正pandas索引的排序顺序
Correcting the sort order of pandas index

我有一个如下所示的数据框。 我的日期字段是dtype datetime64 [ns]:符号高低日期2018-08-16间谍......

Pandas组合多个列(使用NoneType)
Pandas combine multiple columns (with NoneType)

如果之前有人问过/回答过,我很抱歉,经过一段时间的搜索,我找不到这个问题的答案。 非常简单地说我想将多个列组合成一个...

如何迭代数据框中的日期?
How to iterate over dates in a dataframe?

我有一个数据框,其中有一列日期格式如下:“1/1/2016”我想创建一个从该日期开始并转到“1/2/2016”的for循环, “2016年1月3日”,等等。 ...

在for循环中将Dataframes附加在一起
Append Dataframes together in for loop

我觉得这应该很简单,但我仍然对Python有点新意,我正在努力弄清楚我应该做些什么。 我正在抓取历史股票数据,并希望将它们合并为一个...

字数统计列表无法重命名列名称
Word count list unable to rename column names

我有这个代码读取'NAME'列并返回每个单词的单词出现。 temp_df = pd.read_excel('file location here',index = True)final_df = pd.Series(''。join([unicode(i)for i in ...

python使用秩数来选择两个数据帧之间的值
python use rank number to select value between two dataframes

我有两个数据帧,如下所示。 我想在数据帧df2中添加一列。 使用df2 ['date']和df2 ['ranking']数字来选择数据帧df中的值,例如在df2中,行零日期是20130101,...

R:获取向量的每个项目的最小值/最大值与单个值相比较
R: Get the min/max of each item of a vector compared to single value

我想将单个值与向量的每个项目(data.frame列)进行比较,并接收新的向量作为结果。 a < - data.frame(v = c(3,1,5))n < - 4 b < - #get get of a a $ v`和`n` and ...

将Spark DataFrame转换为HashMaps的HashMap
Convert Spark DataFrame to HashMap of HashMaps

我有一个如下所示的数据框:column1_ID column2 column3 column4 A_123 12 A 1 A_123 12 B 2 A_123 23 A 1 B_456 56 DB 4 B_456 ...

使用pandas中dataframe1中一列的值查找dataframe2中特定列的值
find the value of a specific column in dataframe2 using the value of one column in the dataframe1 in pandas

我在网上做了一些搜索。 我找不到确切的案例。 我需要帮助。 我有两个数据框,其中一个列包含类似的项目。 >>> df1 ID项目......

将Dict数组转换为DataFrame的惯用方法是什么?
What is the idiomatic way to convert an Array of Dict to a DataFrame

我正在尝试将Dict数组转换为DataFrame。 这样做的惯用方法是什么? 使用HTTP,JSON函数getBody(resp)jsonb = String(resp.body)bodyData = JSON.parse(jsonb)end ...

在pandas中的groupby中滚动应用函数
Apply function on a rolling basis within groupby in pandas

我有一个如下所示的数据框。 符号范围日期2018-08-16间谍1.5 2018-08-17间谍1.2 2018-08-16 ...

Python Dataframe错误切片
Python Dataframe wrong slicing

您好我的代码如下所示:data = pd.read_csv('people_wiki.csv')obama = data.loc [data ['name']。str.strip()=='Barack Obama'] print(str(obama [ 'text']))我的输出是:35817 barack hussein obama ...

调用函数时设置列名
Set column names while calling a function

考虑我们有一个数字data.frame foo,并希望找到每两列的总和:foo < - data.frame(x = 1:5,y = 4:8,z = 10:14,w = 8:4 )bar < - combn(colnames(foo),2,function(x)foo [,x [1]] + foo [...

Count_values,其中where条件计算一列相对于另一列的值
Count_values with where condition to count values of one column with respect to other

我正在对我的数据做一些EDA,这是pandas数据框架,我现在陷入困境。 我不知道如何计算党= =共和党人或民主党人的婴儿价值观。 我想应用value_counts ...

两个pandas数据帧之间的快速spearman相关性
Fast spearman correlation between two pandas dataframes

我想将spearman相关应用于具有相同列数的两个pandas数据帧(每对行的相关性)。 我的目标是计算spearman相关性的分布......
1 2 3 4 5 6 7 237 238