网站首页 > 教程文章 正文
最近在一个项目的研发过程中,起初采用pandas读取数据,数据量不大的时候pandas的优越性就不言而喻了,非常方便快捷。后来随着数据量的增加问题就出现了。当.csv行数超过1048576行时,32位win7提示这是最大的行数。说明单表容量在32位操作系统是受限的。强行增大单表文件大小。实践中单表最大1.3GB,结果python使用pandas根本无法打开。只能改变数据库方式。
研究当前数据库潮流以及便捷性,决定采用sqlite3 数据库。采用数据库就需要把大量数据导入sqlite库中。最开始没深入考虑就按照常规数据库方法读写数据库。实践表明单表传统一条一条写入数据库一天只能完成十万条记录插入。系统起码有1300万条数据,那导入时间那是不可想象的。网上查了很多资料加上实验。采用批量事务提交能几百倍的提高效率。实战测试一分钟左右就能完成10要数据插入。这是什么效率,天壤之别的优化!
猜你喜欢
- 2025-09-23 5分钟快速掌握在Python使用SQLite数据库,
- 2025-09-23 ExcelVBA 连接 MySQL 数据库_vba怎么连接数据库sql
- 2025-09-23 Python+SQLite 终极实战指南:零基础到高效开发
- 2025-09-23 搭建electron+vite框架的三种方法
- 2025-09-23 免装环境!SQLite 可视化神器,Java 开发者速通指南
- 2025-09-23 没想到一个Trae的提示词工具,居然会有这么多人喜欢?
- 2025-09-23 SQLite线程模式讲解_简述sqlite3的功能
- 2025-09-23 ExcelVBA:创建SQLite数据库,以及CRUD基本操作函数(1/2)
- 2025-09-23 Qt编程进阶(21):Qt操作SQLite数据库及实例
- 2025-09-23 Python (Sqlite)用事务写多表数据的简单例子
- 最近发表
- 标签列表
-
- location.href (44)
- document.ready (36)
- git checkout -b (34)
- 跃点数 (35)
- 阿里云镜像地址 (33)
- qt qmessagebox (36)
- mybatis plus page (35)
- vue @scroll (38)
- 堆栈区别 (33)
- 什么是容器 (33)
- sha1 md5 (33)
- navicat导出数据 (34)
- 阿里云acp考试 (33)
- 阿里云 nacos (34)
- redhat官网下载镜像 (36)
- srs服务器 (33)
- pico开发者 (33)
- https的端口号 (34)
- vscode更改主题 (35)
- 阿里云资源池 (34)
- os.path.join (33)
- redis aof rdb 区别 (33)
- 302跳转 (33)
- http method (35)
- js array splice (33)
