我正在基于包含名称和描述的文件构建数据集,最近我获得了一个文件,该文件具有包含名称和名称的相同名称列表。我希望能够将项目描述添加到文件中,或者只是查找项目编号和名称,并查看同一行中是否有任何匹配项。 这只是必须处理新添加的第二个文件的代码的一部分
文件1的格式如下:
名称 描述
文件2的格式为: 名称项目#
我的目标是能够从文件1中提取名称,并搜索文件2中是否存在特定项目编号,并将其作为变量输出,以便在代码的下一部分中使用,并与其他一些文件一起作为csv文件输出。从项目描述中获得的信息。
到目前为止,这是我的代码:
for line in file1 :
if ">" in line:
name=line[1:7]
open(file2,"r")
item1="51257"
for line in file2:
i51257=0
if name and item1 in line:
print("1")
i51257+=1
elif name and ps1 not in line:
p51257+=0
file2.close()
if ">" not in line:
counted = Counter(line)
divisor= str(1000/counted)
csvout.append(name + "," + divisor + "," + counted + "," + str(i51257))
csvfinal='\n'.join(csvout)
file1.close()
open(csv1, "w")
csv1.write(csvfinal)
csv1.close()
我的预期输出应为:
Name, Divisor Value, Length of Line, Number of Times Item1 appears
Name, Divisor Value, Length of Line, Number of Times Item1 appears
但是我在除数行中得到了除以零的错误,这在添加第二个要读取的文件之前没有发生。