说明样本限制的影响:简化生成条形图的方法
Illustrating the impacts of sample restrictions: Simplifying the way to produce a barplot

我试图通过ID来说明在条形图中连续应用各种(减少限制性)样本限制的样本大小的效果:蓝色条...

检查在data.table中使用by创建的块
Inspect blocks created with by in data.table

有没有一种简单的方法来检查在data.table中使用'by'时创建的数据块之一? 例如,如果我通过'Species'分组iris ir < - data.table(iris)ir [,someFunction(),by = ...

使用data.table步骤
Using step with data.table

我可以执行如下操作:foo = data.frame(y = rnorm(100),x1 = rnorm(100),x2 = rnorm(100),x3 = rnorm(100))full = lm(foo) $ y~foo $ x1 + foo $ x2 + foo $ x3)nil = lm(foo $ y~1)fwd = step(nil,...

按索引替换行
Replace rows by index

在以下示例中:library(data.table)df1 < - data.table(“1A”= c(0,0,0,0),“1B”= c(4:3),“2A”= c( 0,0,0,0),“2B”= c(4:3))df2 < - data.table(“1A”= c(0,0),“1B”= c(1:2),“ 2A“= c(0,0),”2B“= c(1:2))...

data.table中的最佳方式,可以从列名字符串的向量中创建多个列
Optimal way in data.table to make multiple columns from vectors of column name strings

我目前正在尝试使用data.table并寻找“最佳”的做事方式。 我想在下面的例子中做的是有一个带有列名的字符串,为正常附加“.d”...

当nrow> 100时,data.table打印错误
data.table print error when nrow>100

打印data.table时会发生奇怪的错误,但仅当data.table大小超过100时(例如下面的例子)。 用print.data.frame()替换print()时,错误消失。 因此,我......

通过指标变量列中表示的“组”聚合data.table的好方法?
Good way to aggregate in data.table by a 'group' represented in a column of indicator variables?

我有一个data.table对象,其中包含0和1的各种列,代表不同的“场景”,我希望在这些列中聚合列的值。 像这样的东西:require(data.table)set ....

按组在每个单元格中存储一个向量
store a vector in each cell by group

大家好我正在寻找一种在每个单元格中存储矢量的方法,这里是样本数据集。 dt1 < - data.table(id = rep(1:2,each = 3),set.a = c(5,1,3,10,4,7))dt1 id set.a 1:1 5 2: 1 ...

R data.table列名的保留字?
Reserved words for R data.table column names?

我在data.table中找到了关于特定列名称的一些尖锐边缘。 我怎样才能避免割伤自己? 假设我有一个data.table,有两列,'type'和'value'。 numRows = 100 ...

attr(*,“internal.selfref”)= <externalptr>出现在data.table Rstudio中
attr(*, "internal.selfref")=<externalptr> appearing in data.table Rstudio

我是R data.table包的新用户,我注意到我的data.tables中有一些不寻常的东西,我在文档或本网站的其他地方没有找到解释。 使用数据时....

如何使用动态确定的列名和截止限制在data.table中选择行?
How to select rows in data.table with dynamically determined column name and cut off limits?

我想编写一个函数,从数据表中选择一个属于动态命名列的特定范围内的行。 试着写这个,我发现自己无法通过...进行行选择

R数据表:将行值与组值进行比较,条件为
R data table: compare row value to group values, with condition

这是问题的延伸:R数据表:将行值与我现在拥有的组值进行比较:x = data.table(id = c(1,1,1,1,1,1,1,1),price = c(10,10,12,12,12,15,8,11),subgroup = c(1,...

分组依据data.table选择最小日期
Group by and select min date with data.table

我的数据df1 < - 结构(列表(ID = c(“A”,“A”,“A”,“B”,“B”,“C”),c1 = 1:6,c2 = 1:6, myDate = c(“01.01.2015”,“02.02.2014”,“03.01.2014”,“09.09.2009”,“10.10.2010”,“06.06.2011”))。。Name = ...

将NA值替换为时间系列中的相邻值或同一列 - data.table方法
Replace NA values with adjacent value in the time series or in the same column - data.table method

样本数据df < - data.frame(id = c(“A”,“A”,“A”,“A”,“B”,“B”,“B”,“B”),年份= c( 2014,2014,2015,2015),月= C(1,2),marketcap = C(4,6,2,6,23,2,5,34),返回= C(NA,0.23,0.2,0.1 ,0.4,0.9,NA,0.6))df1 id年...

如何应用操作data.table的函数并使用2个或更多值作为参数R.
How do I apply a function that operates a data.table and use 2 or more values as a parameter R

我有以下数据。表格k v1 v2 v3 v4 1:1 US a up 2:2 CA a up 3:3 US b down 4:4 CA a down 5:5 US b up 6:6 CA b down and I想要重新创建以下内容......

data.table聚合在R中遇到NAs问题
data.table aggregation having trouble with NAs in R

我正在使用data.table包将每个时间段内多个观察的面板聚合到一个面板中,在该面板中有一个独特的时间段位置观察....

使用data.table中某些列的值来确定将使用哪些剩余列
Using the values of some columns in a data.table to determine which remaining columns will be used

这是我的数据集,library(data.table)df < - data.table(id = 1:8,start = c(1,2,2,1,3,3,1,2),end = c( 1,3,3,3,3,3,2,2),t1 = c(0,1,1,1,1,0,1,0),t2 = c(0,0,...

在data.table中将tail与by结合起来
combining tail with by in data.table

获取data.table尾部的最佳方法是什么? 我说:> dt < - data.table(category = c(“A”,“A”,“B”,“B”,“B”),value = c(1,2,3,4,5) ))> dt类别值1:...

data.table来自另一列的列差异集
data.table difference set of columns from another column

我试图用data.table区分另一列的一组列。 这是一个简单的例子:library(data.table)dt < - data.table(a = 1:10,b = 11:20,d = 21:30)mycols < - c(“b”,“d”)dt [,C(...

如何获取具有一列指定公式的data.table,还显示其余列?
How do I get a data.table with a specified formula for one column but also display the rest?

假设我有一个具有任意数量列的data.table但是假设它很多。 我想查看一列转换但其他列不转换的表。 假设我想要的专栏......

按键拆分R中的data.table
split a data.table in R by key

我在R中有一个data.table对象,我想沿着它的键分割。 > myTable [1:11] ID长度哈希1:2578 52.5 26566273 2:4066 52.5 26566273 3:2578 53.5 26566273 4:...

什么是最“data.table”的方法,从不同的data.table为data.table的列赋值
What is the most "data.table" way to assign values to a column of a data.table from a different data.table

我试图将data.table b中列“True_value”的值分配到data.table a中的同名列中。 我终于确实得到了一些工作,但我不确定1)为什么它起作用2)...

解压缩列表的R数据帧列
Unpack a R data frame column of lists

在RI中有一个data.frame(或data.table)。 在这个data.frame中,我有一个列,每个单元格都包含一个列表列表(data.frame)。 我可以将此列转换为单个data.frame ...

R:在关注键时比较data.table和传递变量
R: Compare data.table and pass variable while respecting key

我有两个data.tables:原始< - data.frame(id = c(rep(“RE01”,5),rep(“RE02”,5)),date.time = head(seq.POSIXt(as.POSIXct) (“2015-11-01 01:00:00”),as.POSIXct(“2015-11-05 01:00:00”),60 * 60 * 10),10))...

data.table:按列名匹配分配给列
data.table: assign to columns by column name matching

假设我有一个数据表> dt = data.table(Faaa = c(1,2,NA),Fbbb = c(2,NA,3),date = as.IDate(c(“2010-01-01”, “2010-01-02”,NA)))> dt Faaa Fbbb date 1:1 2 2010-01-01 2:2 ...

内存有效地将行插入到data.table对象中?
A memory efficient insertion of a row into a data.table object?

我有一个脚本,通过使用循环逐行插入数据来创建数据表。 插入是使用rbindlist()完成的。 这种方法似乎变化很大,因为似乎每个......

子集data.table列用于计算新值但保留所有旧列+新值
subset data.table columns for calculation of new value but keep all old columns + new value

我很难说出问题的标题,所以如果有人能提出更准确的标题,我将不胜感激。 我有一个约100个样本的矩阵和~200,000个特定位置的读数....

重复微小的差异
Duplicated with a tiny magnitude difference

我在data.table对象上使用了复制函数。 它在两个似乎相同的值上返回FALSE。 深入研究它们,看起来它们之间存在微小差异(-1 ...

如何使用data.tables按附近值进行分组
how to group by nearby values using data.tables

我的数据如下所示:ID1 ID2 Time diff 1:1958616 P209576 4/15/2016 7:46 NA mins 2:1958493 P209580 3/23/2016 9:41 -33005.16793 mins 3:1958493 P209580 3/25/2016 15: 41 ...

如何在R中合并之前创建ID(by)?
How to create ID (by) before merging in R?

我有两个数据帧df.o和df.m,如下所述。 我需要找到df.o(维度表)中的哪个观察对应于df.m(事实表)中基于两个标准的观察结果:1)df.o $ Var1 = ...

如何为R中的每个类别创建计数列
How to create a count column for each category in R

我有一个这样的数据帧:ID < - c(“A”,“A”,“B”,“B”,“A”,“B”,“B”,“B”,“A”,“A “,”A“,”A“,”B“,”B“,”A“,”A“,”A“,”B“,”B“,”B“)测量< - c(”Len“ ,“Len”,“Len”,“Wid”,“Ht”,“Ht”,“Wid”,“Len”,“Ht”,“Ht”......

将来自不同行数的表与主MAP表组合在一起
Combining tables from different numbers of rows with a master MAP table

该数据集表示基因组图谱位置(chr和start),其中20个个体(dat)的每个位置的测序覆盖度(深度)的总和示例:gbsgre < - “chr start end depth ...

我可以使用setkey()获取data.table中数字列的所有行吗?
Can I get all rows for numeric columns in data.table with setkey()?

如果我在字符列data.table上使用setkey返回所有行,例如DT < - data.table(V1 = c(1L,2L),V2 = LETTERS [1:3],V3 = round(rnorm(4),4 ),V4 = 1:12)setkey(DT,V2)DT ['A'] = V1 V2 V3 ...

data.table和.SDcols用paste0创建一个字符向量
data.table and .SDcols with paste0 to create a character vector

鉴于data.table,DF下面,我想选择除了编号为6和8的组的第一行以外的所有行。我被告知我应该使用paste0()。 我有一个给出预期的解决方案......

使用R对组进行标准化/白化/重新缩放数据
Standardising / whitening / rescaling data by group with R

我有一些具有非常不同范围的功能的分组数据。 我想按组标准化每个功能。 另外,我想在任意大量选择上执行此操作...

R data.table,J中用户定义函数的命名空间
R data.table, namespace for user defined function in J

我有一个如下所示的数据表。 我想计算每个市场的回报与每个信号的相关性。 dt = data.table(mkt = rep(字母[1:3],每个= 3),rtn = rnorm(9),...

使用with data.table
Using by with data.table

在这里,我尝试使用data.table中的by参数对每个组中的预测列进行排名。 我无法理解为什么以下代码不起作用:> x ....

data.table:在满足条件后删除所有行
data.table: removing ALL rows after a condition is met

我在这里阅读了很多关于数据子集的线程,但是我没有找到任何能够回答我关于对时间序列数据集进行子集化的特定问题。 我想做的是找到行......

从格式化的字符串列复制data.table行
Duplicate data.table rows from formatted string column

问题:R中转换data.table的最佳方法是什么,如下所示:>输入id值节点1:1 foo node3 2:2 bar节点[2,4] 3:3 qux节点[2-4] 4:4 ......

r函数调用中的data.table用法
r data.table usage in function call

我想在函数调用中反复执行data.table任务:减少大型分类变量的级别数我的问题类似于Data.table和get()命令(R)或传递列...

使用data.table删除R中的行[duplicate]
Remove rows in R using data.table

df: - 日期名称薪资2015年第1季度ABC 10美元2015年第2季度ABC 11美元2015年第3季度ABC 15美元2015年第1季度XYZ 25美元2015年第2季度XYZ 20美元我希望从总频率小于3的数据中删除行。对于......

基于指定间隔的地图值
Map Value based on Specified Intervals

假设我们有以下data.table:library(data.table)dt < - data.table(x = c(-0.01,-0.001,0,0.01,0.02,0.03,1,3,4,10,20) ,25),value = c(rep(1,3),rep(2,3),rep(3,2),rep(4,2),rep(5,2)))...

有条件地按其他列值填充列
Conditionally fill column by other columns values

我有大约400万行个人数据,如下所示:姓名< - c(“彼得”,“彼得”,“彼得”,“彼得”,“彼得”,“彼得”,“彼得”,“丽莎” “,”伯特“,”卡琳“,”卡琳“,”卡琳“,”......

R:在apply()函数内使用data.table
R: Using data.table inside the function of apply()

我有距离矩阵,每行都是一个人,每列都是一个设施。 单元格显示从个人到设施的长度。 >头(ODMatrix,5)toFacility1 toFacility2 ......

在data.table中选择最接近的成对匹配
Selecting nearest pairwise match in data.table

我有一个R data.table,其结构如下:> str(dat)Classes'data.table'和'data.frame':26802896 obs。 4个变量:$ id:chr ... $ date1:​​日期,格式:“2011-12-15”“2012 -...

R data.table条件查找/替换
R data.table conditional find/replace

我有一个data.table(sbd_sbmolbio_n)。 我需要找到2个条件为真的行:ORF_SEQUENCE包含“MKTIIALSYIFCLVFA”N_TAG包含“Signal Seq”然后我需要替换“Signal Seq”...

在data.table中使用max时缺少列[重复]
Missing columns when using max in data.table

我试图获取data.table data.table中的顶级频率字:dtable4G键频率值============================ ====感谢612支持感谢...

R-使用指数列表计算数据帧的若干列中的一组值的平均值
R-Using a list of Indices to calculate the mean of a group of values in several columns of a data frame

我有一个索引列表,我想用它来计算从我的索引开始的行数的平均值。 理想情况下,我会找到一种方法同时为多个列执行此操作。 我的清单......

数据表在j中添加过滤后的计数
Data table add filtered count in j

我在R中有以下数据表:set.seed(5)my_data < - data.table(cat_1 = c(1,1,1,2,2,1,1,1,3,4,5,4, 5),cat_2 =样本(c(“A”,“B”),13,replace = T),...

R:如何在过去几天获得变量的滚动均值,但仅限于给定的小时?
R : how to get the rolling mean of a variable over the last few days but only at a given hour?

考虑这个时间< - seq(ymd_hms(“2014-02-24 23:00:00”),ymd_hms(“2014-06-25 08:32:00”),by =“hour”)group < - rep(字母[1:20],每个=长度(时间))值< - 样本(-10 ^ 3:10 ^ 3,长度(时间),...
1 2 3 4 5 6 7 72 73