原帖由 TotemG 于 2016-11-11 15:04 发表
有很多,其中一款只有100多k:
http://www.iplaysoft.com/finddupfile.html
原帖由 @真忘私绵 于 2016-11-11 15:22 发表
有些不明白,比如说这个左边和右边不是同一个文件吗?
为啥是重复的
886201
原帖由 @dreamlost 于 2016-11-11 17:48 发表
路径不一样
原帖由 @真忘私绵 于 2016-11-11 18:50 发表
你看看图一样啊
原帖由 @n2 于 2016-11-11 19:11 发表
请多看几次。。。。。。。。。
原帖由 @真忘私绵 于 2016-11-11 19:20 发表
喔喔 我sb了
那是不是右边都删了没风险?
原帖由 @安非他命 于 2016-11-11 21:36 发表
自己写代码
从起始目录开始遍历
每个文件算md5
相同的只留一个
原帖由 @安非他命 于 2016-11-12 16:07 发表
老天爷
https://github.com/artzers/Pytho ... eleteRepeatFiles.py
原帖由 @安非他命 于 2016-11-12 19:48 发表
这么多文件!
好厉害哦!
好高端哦!
肯定是高级程序员才可能有这么多文件哦!
原帖由 @solbadguy 于 2016-11-12 21:59 发表
我也一直找这个作用的软件,但是不太理想。比如一张图片有几个大小,想保留质量最好那张。
原帖由 @备常炭 于 2016-11-12 10:02 PM 发表
这个功能我厂手机app上面有…pc端真有很大需求吗?真要呼声很高我可以要代码看看能不能搞搞
原帖由 @备常炭 于 2016-11-12 21:55 发表
实际上我公司的开发机是4T硬盘现在有650w文件,因为确实代码很多而且svn本地缓存就不说了
我认为py是搞不定的,实际上用c++不来点狠的方法32位程序也不太容易,无论是内存占用还是速度,要是扫一遍要几天那毫无价值
原帖由 @solbadguy 于 2016-11-12 22:14 发表
我觉得摄影爱好者或者图片多的人都需要吧。有时候编辑过图片大小,或者调整过尺寸,又另存一张。这样一张图片就要有很多个版本,但是真正需要保存的一般都是原始图片。我现在只能用超大缩略图来筛选,但是超大缩略图有时还是分不清细微区别,但是一张张用看图软件打开筛选会死人的……
原帖由 cc0128 于 2016-11-13 09:17 发表
posted by wap, platform: Samsung
算了下。md5 hash 是128bit 长度。
假如1000w个文件内存占用 128 * 1000w = 160MB。
计算时间 貌似md5 是O(n) 复杂度?(n 为文件大小)
loop一遍file也是o(n)?
对比hash用has ...
原帖由 @备常炭 于 2016-11-13 13:19 发表
too young……
就一个文件来说,MD5才16个byte,那么消重和删除还得有文件的路径吧,你存吗?
就算存NTFS FRN这还是要多8个字节,这就240MB了,存全路径直接血崩。当然不用存全路径,内存里放个目录树就行了,每个文件指向自己的parent dir,这个指针4个字节,又多了40M
当然这都是只算数据本身,没有算容器的内存消耗,我只想说无论是vector还是map还是hashmap在这个数量级上都是血崩的,特别是new(malloc)本身的内存消耗。
不信你new 1000w个 16字节的结构体看看用了多少内存。
前段时间蛋疼恰好撸了这么一个玩意,直接上C++不用奇技淫巧,600w文件用大于1G内存。当然后来我用奇技淫巧优化后好看太多就不说了。
原帖由 @安非他命 于 2016-11-12 16:07 发表
老天爷
https://github.com/artzers/Pytho ... eleteRepeatFiles.py
原帖由 @n2 于 2016-11-18 23:37 发表
顶一下,1楼那个很不错,速度快, 但是比较sb只能全选右边。。。不能选左边。。太多的话就用按键精灵来按。
然后是后面提到的 pro ,http://dl.pconline.com.cn/download/61067.html 我要找相似名称。。看看行不行
原帖由 @真忘私绵 于 2016-11-18 23:42 发表
左边是你初始选的硬盘
原帖由 @n2 于 2016-11-19 00:52 发表
然而不是。。。。。。。。。。。。。。。。。。。我试过切换上面的目录,下面的没区别。。
欢迎光临 TGFC Lifestyle (http://club.tgfcer.com/) | Powered by Discuz! 6.0.0 |