如果仅在Python / RStudio中编写SQL语句,为什么存在允许MySQL数据库连接到Python / R的包?

我最初想使用现有的CSV文件从头开始创建MySQL数据库,并且在进行探索性数据分析之后,我将使用RStudio中的功能来进行一些更高级的统计分析。

After looking at a few guides, it seems that they all include connecting to the MySQL database, only to end up writing the SELECT * FROM <database>....; queries that could have been easily accomplished in MySQL in the first place.

为了说明,

https://www.datacamp.com/community/tutorials/mysql-python

https://programminghistorian.org/en/lessons/getting-started-with-mysql-using-r

我的问题是双重的。

1)为什么不只是在MySQL中做所有事情,而不是将表导入R / Python,然后在那里做同样的事情?

2)对于我的情况(进行统计分析),是否仍建议建立与RStudio的连接以进行统计分析?

我的最终目标将是遵循这种思路。

1)将数据库导入RStudio。

2) Run statistical tests. Eg. chisq.test(table1.column1, table2.column1)

这可能吗?还是我的方法首先是错误的?

评论