博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
csv批量导入mysql命令
阅读量:6184 次
发布时间:2019-06-21

本文共 1398 字,大约阅读时间需要 4 分钟。

今天把从Kaggle上下载下来的csv数据导入mysql,想做个统计分析,怎奈csv文件有些大。所以仅仅能用mysql 命令导入,现mark下,以备以后不时之需:

1. 导入:

基本的语法:load data [low_priority] [local] infile 'file_name txt' [replace | ignore]into table tbl_name[character set gbk][fields[terminated by't'][OPTIONALLY] enclosed by ''][escaped by'\' ]][lines terminated by'n'][ignore number lines][(col_name, )]

导入命令_example:

load data infile 'csv文件路径\\test.csv' replace into table 表名              fields terminated by ',' optionally enclosed by '"' lines terminated by '\n' ignore 1 lines(Id,@dummy,DayOfWeek,PdDistrict,Address,X,Y);

不要小看这个简单的example。包括了非常多东西;

第一行就是导入文件;

第二行參看语法就会发现有两个词:replaceignorereplaceignore关键词控制对现有的唯一键记录的反复的处理。假设你指定replace。新行将取代有同样的唯一键值的现有行。假设你指定ignore。跳过有唯一键的现有行的反复行的输入。假设你不指定不论什么一个选项,当找到反复键时,出现一个错误,而且文本文件的余下部分被忽略。

所以我认为现实情况下你的表设计主键。还是最好要不会反复的字段;

第三~四行非常easy就是每一个详细字段内容之间是以逗号隔开的,那就以逗号分开。

erminated by描写叙述字段的分隔符。默认情况下是tab字符(\t)
enclosed by描写叙述的是字段的括起字符。就是说字段中假设有引號。就当做是字段的一部分。
语法中另一个是 escaped by, 它描写叙述的是转义字符。

默认的是反斜杠(backslash:\ )

第五行 lines terminated by是对每行进行切割。这里要注意一个问题。假设csv文件是在windows下生成,那切割用 ‘\r\n’。linux下用 ‘\n’。

第六行中 ignore 1 lines 是忽略第一行。由于第一行往往是字段名。后边括号里有个字段非常特别 @dummy,它是说假设csv文件里有个字段我不想插进去。那就把相应字段名变成@dummy。

PS:想顺便插入导入时间。就在最后加上set update_time=current_timestamp。

2. 导出:

同一时候附带上导出命令:

select * from 表名into outfile '导出路径\\test.csv' fields terminated by ',' optionally enclosed by '"' escaped by '"' lines terminated by '\n';

希望多多交流!

转载地址:http://xbsda.baihongyu.com/

你可能感兴趣的文章
Android Handler机制之Message及Message回收机制
查看>>
JSON vs Js
查看>>
css居中
查看>>
谈谈分享邀请奖励机制(附iOS实现代码)
查看>>
多隆:淘宝第一行代码撰写者的程序世界
查看>>
【刷算法】翻转单链表的递归和非递归方法
查看>>
十步零基础JavaScript学习路径
查看>>
vue-cli 3.0新特性解读
查看>>
第一个tensorflow程序
查看>>
从问题出发看JAVA编程规范
查看>>
【译】Swift算法俱乐部-快速排序
查看>>
150年前,他对拿破仑做数据可视化
查看>>
Kafka走查
查看>>
Ribbon 框架简介及搭建
查看>>
Vue 模板编程实践 之 巧用过滤器
查看>>
Node.js 服务器
查看>>
小议JS原型链、继承
查看>>
对比几段代码,看看你是 Python 菜鸟还是老鸟
查看>>
在Ubuntu 16.04 / 17.10 / 18.04上安装Oracle Java JDK 11
查看>>
算法-无重复字符的最长子串
查看>>