博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
160802、1.06s删除10w条重复记录只保留一条(mysql)及linux删除乱码文件
阅读量:5079 次
发布时间:2019-06-12

本文共 866 字,大约阅读时间需要 2 分钟。

上次发表过的一遍删除重复记录的文章,其中最优的方案三删除1w条也花了0.07秒而2w条就已经花掉了4秒。今天进行了进一步优化,测试删除10w条只花了1.06秒。速度提升了很多。

建表语句

CREATE TABLE `test_user` (

  `id` INT(10) NOT NULL DEFAULT '0',

  `namea` VARCHAR(40) NOT NULL,

  `nameb` VARCHAR(40) NOT NULL,

  `user_id` VARCHAR(40) NOT NULL,

  PRIMARY KEY (`id`)

) ENGINE=INNODB DEFAULT CHARSET=utf8 ;

新方案:(其中user_id是重复字段,保留一条)

DELETE FROM test_user WHERE id NOT IN (SELECT id FROM (SELECT MAX(id) AS id FROM test_user GROUP BY user_id) X);

10000条删除9990    20000条删除19990      100000条删除199990

0.062sec           0.018sec                                 1.060sec

 

另外总结了一条删除linux乱码文件的方法:(其中红色部分就为inode(index node) ,-i选项用于显示inode)

[root@localhost test]# ls
?????.txt[root@localhost test]#  ls -lih
total 4.0K
1061229 -rw-r--r--. 1 root root 104 Jul 24 20:16 ?????.txt

[root@localhost test]# find . -inum 1061229 -exec rm {} -rf \;

[root@localhost test]# ls -l

total 0

转载于:https://www.cnblogs.com/zrbfree/p/5736456.html

你可能感兴趣的文章
64位ubuntu 16.04 LTS安装搜狗输入法过程
查看>>
利用sfntly的sfnttool.jar提取中文字体
查看>>
tomcat8热部署配置--maven自动发布项目到tomcat8(如何支持远程访问部署)
查看>>
(2)Python索引和切片
查看>>
有关自动化构建gulp的搭建
查看>>
BZOJ1009 矩阵快速幂+DP+KMP
查看>>
2013年工作总结
查看>>
连接到github
查看>>
vim-DrawIt
查看>>
如何用Fiddler手机抓包
查看>>
学好Mac常用命令,助力iOS开发
查看>>
rac one node在线relocation
查看>>
2565放大的X(hdu)
查看>>
重温数据结构系列随笔:单链表(c#模拟实现)
查看>>
读取线图层上的点,输出为点图层
查看>>
pku 1840 Eqs 哈希处理
查看>>
ucos任务优先级从64到256,任务就绪表的改变
查看>>
//C#中的访问数据符
查看>>
217. Contains Duplicate
查看>>
vue2.0 关于Vue实例的生命周期
查看>>