python / pandas是否可能?如果是这样,您能指出我正确的方向吗?谢谢。
我有一个txt文件报告,我想将其转换为表格结构,可以轻松地分析,操纵,收集见解等。
我将示例txt和excel文件上传到了Google驱动器(不确定如何在此处共享)。 excel文件是理想输出的一个示例。
Link to Sample Txt file and ideal output Excel file
一些背景:
- 每天下载txt文件报告
- 报告可能长达数百页
- 每页60行,具有相同的页眉和页脚
- 记录以块格式构造
- 记录全部以“#”开头。最大#大概是20
- 我希望每个块都是一个列/字段
- 每行将是贷款编号的冻结信息
- 有时,贷款编号将有多个相同的条目
- 基本信息,但在不同日期输入不同的数据(请参阅
- 例如0000000001)
- 如果基本信息能重复一遍,那就太好了
- 用新行更新新信息