• 在R中,尝试为列表中的所有元素匹配并返回驻留在列中的字符串的PART并存储唯一的字符串

    我陷入了处理一个excel文件的多个工作表的问题,在该工作表中,我想访问每个工作表的特定列中的字符信息,并希望整理出唯一的字符并返回它们。 我已经使用read_excel函数读取了excel文件,并将每个excel工作表排序为一个列表元素。到目前为止,该列表中有15张纸/元素。每个小节的行号都不同,但是它们具有相同的列布局。幸运的是,存储感兴趣信息的列称为“ well_sample”。 “ well_sample”中的每个行条目都遵循ID_Time_Condition_sample_dose格式。 例如:S...
  • 删除stat_density_2d的最低级别/ bin?

    我在溜冰场的图像上绘制了曲棍球射击位置的等高线图/热图,但噪音太大。特别是最低的纸槽是完全不必要的,并且会破坏图像。有没有办法摆脱这个垃圾箱?我希望它看起来像这样: 代码和图片: ggplot(full_data, aes(x=xCordall, y=yCordall)) + background_image(img)+ stat_density_2d_filled(aes(fill= ..level..),geom = 'polygon',alpha= 0.8)+...
  • 按小时创建日期和时间的向量

    我想创建一个跨越预定日期(日期范围)的每小时间隔(特定的开始和结束时间)的向量。 没有日期范围,我设法 seq(as.POSIXct("2020-02-20 09:00:00"), as.POSIXct("2020-02-20 18:00:00"), by="hour") 产生 2020-02-20 09:00:00 2020-02-20 10:00:00 2020-02-20 11:00:00 2020-02-20 12:00:00 2020-02-20 13:00:00 2020-02-20 14:0...
  • 在一个数据集中查找与R中另一个数据集中的坐标缓冲区匹配的坐标

    我有两个数据集,一个较小的数据集(4000行)包含有关每个店铺经纬度坐标的不同商店的信息,一个较大的数据集(600K行)包含有关经纬度坐标在该地区居住的人的信息。我试图找出在距每家商店一定距离内有多少人居住。我也想对多个距离进行此操作。 IE-为每家商店找到距离商店200米,500米,1公里,2百万以内的人口。 我如何才能使用R有效地做到这一点? 简短的伪代码如下 for(store in stores){ for(distance in distances){ store[distance] ...
  • 转换R中的降雨量单位

    给定以米为单位的小时降雨数据,如何将以米为单位的小时数据转换为kg / m ^ 2 / s? rainfall (m)=c(1,2,3,4,5) 我追求的解决方案是利用可以应用环境数据的基于R的软件包或功能的解决方案。 有什么想法吗?
  • 如何创建以函数参数命名的数据框并重新绑定它们?

    我的目标是使巴西家庭调查中的一些数据实现和分析自动化。为此,第一步是创建一个功能,该功能可以下载并按行绑定住户调查的多个版本。 优点是,我已经具有下载单独版本的家庭调查的功能。它称为“ PNADcIBGE :: get_pnadc”。此函数作为参数“年”和“季度”。因此,要做的很长的路要走: install.package("PNADcIBGE") library(PNADcIBGE) pnad_2012_1 <- get_pnadc(year = 2012, quarter = 1) pnad_2012_...
  • 条件配对t检验

    我有一个t统计矩阵。我想进行两尾t检验。矩阵具有负值和正值。 当t统计量为负时,适当的检验是: 2*(pt(t, 48)) 当t统计量为正时,相应的检验为: 2*(1-pt(t, 48)) 我想要一个对每个元素应用适当的t检验,并得出一个以p值为元素的矩阵的函数。 数据: structure(c(NA, 0.239348325523128, 0.287295289074944, NA, NA, NA, NA, -0.47787610619469, -3.29364477531891, 1.402074...
  • R循环将数据框信息提取到函数中并命名输出

    这里是新的R用户,我在循环上可以在线找到并应用函数的所有信息与我为成功应用到我的问题所做的努力还不够接近,因此任何想法和指导都应是非常感激。 我在R中有一个名为parks.metadata2的数据框,其中包含68行。每行都有我需要进行反向轨迹分析的位置,日期和时间的信息。某些列具有经/纬度数据和日期/时间数据,我想将它们输入到hysplit_trajectory函数中以生成另一个对象,该对象是带有该位置和时间的轨迹信息的小数据框。因此,我想最终得到68个对象,parks.metadata2中的每一行都有一个...
  • R-Dplyr-有条件地对数据框中的同一列进行计数(分组依据摘要)

    我有一个查询生成的数据框(将R脚本中的硬编码sql查询生成)。然后我进行分组并汇总,以获取每位工作人员的最小/最大/观察值。我想做的是,对于每位工作人员,都知道另一列(移动比率)在1.00的5%之内(即0.95 <=移动比率<= 1.05),而观察值的数量(或更好的比例)。 创建了如下的模型: library(dplyr) Roll_Number <- c("1234567", "111111111", "222222222", "333333333", "444444444", "555555555",...
  • 三类具有分类变量的R中的统计分析

    使用R的新手,我正在尝试在三个时间点上评估一组患者。有21位患者具有分类变量(评分为1到6)。这三个时间点按列排列。 因此,每个时间点都有一张21x3的表格(21个分类变量的观察结果(1到6的分数))。 我想比较一下三个时间点的分数是否有显着提高。我使用的是卡方分析,但想了解R中是否有更多合适的测试选项来评估此问题。
  • 有没有办法使用('和“ =〜”)使用复杂的字符串公式创建R函数?

    我正在尝试创建一个R函数,该函数让我指定潜在变量和指标。有没有一种方法可以将以下三行代码转换为一个函数? ' visual =~ x1 + x2 + x3 textual =~ x4 + x5 + x6 speed =~ x7 + x8 + x9 ' 我尝试使用paste和paste0,但是效果不是很好。例如,仅使用一个潜在变量,我尝试了以下方法: myFunction <- function(z, x, ...) {...
  • 分组后去除异常值,然后计算每组的均值

    我有一个数据框,我希望首先在特定列(ID)上进行分组,然后根据分组从特定列(Number)中删除离群值,然后计算每个组的均值。 library(dplyr) id<-c("A","B","C","A","B","B") id<-as.data.frame(id) number <-c(5,10,2,6,1000,12) number<-as.data.frame(number) total<-cbind(id,number) 我尝试了以下方法,但无法正常工作 remove_outliers <- ...
  • 重命名嵌套json中的键

    我有一个嵌套的json。这是内部称为“ info”的json之一: null null { "id": "qwefhu214o", "number": "2346", "date": "28.01.2019" } null null { "id": "esg324lif", "number": "1378", "date": "29.05.2019" } { "id": "gwrs853sdf", "number": "4487", "date": "20.12.2019...
  • DAUTONSA数据集的geom_boxplot上的标签

    我正在尝试为我的箱线图贴上正确的标签(2011-2017): monthly_sales <- read.csv("https://raw.githubusercontent.com/robintux/Datasets4StackOverFlowQuestions/master/Monthly_Sales_2011-2017.csv" ,header = TRUE, stringsAsFactors = FALSE) # BoxPlot ggplo...
公告

《从零开始开发BBS》课程上线啦,快来跟着我一步步搭建属于你的BBS吧。

课程地址:https://www.shiyanlou.com/courses/1436
9折优惠邀请码: ZHwfIjb1

该课程会带领大家一步步的了解并熟悉Go语言开发,如果你是一个Go语言初学者,或者正准备学习Go语言,那么这个课程非常适合你。如果你熟练掌握了本课程中的知识点,相信你就已经入门Go语言开发,并能胜任日常的开发工作了。