• 如何找到所有组合?

    我有一个清单: n = ['n1','n2','n3','n4','n5','n6','n7','n8','n9'] 我想要的是构建一个np.array,其中包含列表的所有排列。 但是有一个限制,我想按顺序将矩阵分为3个部分。一个零件中的相同组合仅需一个。例如: ['n1','n2','n3','n4','n5','n6','n7','n8','n9'] 和 ['n1','n3','n2','n4','n5','n6','n7','n8','n9'] 将会是相同的,因此最终的metrix应该只包含其中...
  • python列表中的每个“单元格”都包含整个数据框,但应位于列和行中

    我正在尝试使python读取一个excel文件并读取多个.csv文件以从中找到索引数据,然后将剩余的项目填充到excel文件中。 一旦我让python找到所有.csv文件,就应该将这些数据连接到一个数据帧中,然后像在Excel中那样将其用于索引匹配。 (在其他方面,我认为应该这样处理)。 我现在遇到的问题是python用来自一个数据帧的所有数据填充对象列表中的一个“单元格”。因此,与其像这样格式化数据: Name,Date,Time,Open,High,Low,Close,Volume,VWAP,Trade...
  • 我想在功能或熊猫中使用过滤

    ze = analysis_data[~analysis_data['name'].str.contains("&|!|@|~|%|\^|\*|\(|\)|_|\=|\+|\?|<|>|{|}|[|]|:|;|/|\'|\"")] print(ze) The problem is to exclude fields that contain characters other than numbers, characters, spaces, #, , . and - in the name column...
  • 熊猫数据框通过重复删除行

    我想删除由熊猫导入python的数据框中的一行。 如果您看到下面的工作表,则第一列多次具有相同的名称。因此,条件是,如果第一列值再次出现在下一行中,则删除该行。如果没有,则将该帧保留在数据帧中。 My final output should look like the following: 目前,我正在通过将每一列转换为列表并通过索引值将其删除来做到这一点。我希望会有一个简单的方法。而不是这种解决方法/
  • 将具有移位功能的lambda应用于多列

    我正在尝试应用“ PPG”(上一个时期的增长)公式,并在涉及多列时堆叠(对于一列来说,效果很好)。 这是示例: import pandas as pd df = pd.DataFrame({"ID": [1,3,2,2,3,1,3], "Date": [20200109, 20200204, 20200307, 20200107, 20200108, 20200214, 20200314], "A": [20,10,40,40,10,20,30],...
  • 使用返回正确输出的函数格式化多个数据帧,然后调用旧变量

    我一直遇到这个问题,但找不到解决方案。我有10个单独的数据框,并尝试使用一个功能一次格式化所有这些数据框。在Jupyter Notebook中运行该函数时,它通过显示格式正确的最后一个数据帧(df10,odds_sb)向我显示正确的格式。但是,当我再次调用应该是新格式化的数据帧之一时,返回的是旧格式。 #Create function to format odds dataframes def format_odds(df1, df2, df3, df4, df5, df6, df7, df8, df9, ...
  • 在数据框中格式化日期时间

    我有一个数据框,其中有多个不同的日期作为索引: 2005-01-02 2005-01-03 2005-01-04 2005-01-04 ... 2014-12-30 2014-12-31 and i want to format them as MM-DD without changing the type to string. Can someone help me with that? And second question: If I do that, can I still use d...
  • 如何用HTML显示熊猫图

    所以我有图表,但是如何用HTML显示呢?我想使用Flask来显示显示我的图表的HTML页面,但是我该怎么做呢? 这是我的代码: import sqlite3 import matplotlib.pyplot as plt import pandas as pd from pandas import DataFrame import matplotlib.pyplot as plt con = sqlite3.connect("/home/pi/test2.db") df = pd.read_sql_qu...
  • 无法使用熊猫将值添加到csv中的每一列

    I have a csv which has the below content AB22e,AD34f,GQ22c,BQ77b,GQ00p 在这里,它仅包含标题。现在,我要为每列添加一个值 所以我有一个字典,在其中维护了列名和要添加的值之间的映射。看起来像这样 col_map = {"AB22e": ["a", "v"], "AD34f": ["c", "w"], "GQ22c": ["p", "l"], "BQ77b": ["a", "d"], "GQ00p": ["oo", "c"]} This ...
  • 在Pandas的许多列中检查NaN

    我想根据给定的列是否包含NaN向我的数据框添加一个二进制列。 我试图用下面的代码来做到这一点。 import pandas as pd dat = pd.DataFrame({'A': [12,34,56,78, 23,None, None], 'B': [90,80,70,23,None, 78, None], 'C': [90,80,70,23,None, 78, None], 'D': [12,34,56,78, 23,None, None]}) dat['A1'] = dat['A'].isnul...
  • df.city.unique()返回的名称顺序与groupby(['city'])不同

    我正在尝试按城市绘制总销售组,并将条形图与对应的城市匹配,我使用了以下代码: best_city = all_data.groupby(['city']).sum() city = df.city.unique() plt.bar(city, best_city['Total']) plt.xticks(rotation=90) 城市返回了“亚特兰大,奥斯汀,波士顿” 但酒吧的x标签是“波士顿,亚特兰大,奥斯丁” 所以我想知道如何用正确的名称来匹配酒吧?
  • 获取列名和异常值的索引

    我正在尝试调查我的异常值是数据错误还是异常的实际数据点。 这是我的代码,用于查找其列名和索引号。 outliers = [] for r in df.index: for c in df.columns: if (df.loc[r,c]>0.6): outliers.append([r,c]) This code works but is inefficient. Is there a better way? The outlier cutoff value is...
  • 如何使用熊猫直接从.CSV文件中的度数秒(DMS)数据作为字符串读取到数据帧中?

    如何使用熊猫直接从.CSV文件中的度数秒(DMS)数据作为字符串读取到数据帧中? 例如: 如果我有一个csv文件,其中包含一列DMS格式的数据,如何将其作为字符串读取到数据框中以进行进一步计算? 76° 17' 51.2399" E 77° 26' 30.8322" E 76° 51' 29.7812" E 75° 45' 41.3540" E 76° 17' 51.2399" E 当我使用pandas.read_csv('test.csv)#test.csv是输入文件时 我收到一个错误 Tracebac...
公告

《从零开始开发BBS》课程上线啦,快来跟着我一步步搭建属于你的BBS吧。

课程地址:https://www.shiyanlou.com/courses/1436
9折优惠邀请码: ZHwfIjb1

该课程会带领大家一步步的了解并熟悉Go语言开发,如果你是一个Go语言初学者,或者正准备学习Go语言,那么这个课程非常适合你。如果你熟练掌握了本课程中的知识点,相信你就已经入门Go语言开发,并能胜任日常的开发工作了。