以专业角度谈谈115网盘的秒传功能
我来以专业角度说说秒传等等功能, 作为微软skydrive开发人员, 我们都深知网盘中存在比较多的重复文件, 特别是音乐. 影片之类, 其实从服务器角度考虑, 服务器在秒传文件时候, 并不是使用所谓的MD5或者CRC32冗余校验循环, 服务器判断文件重复的根据主要是文件头和文件散扇区校验. 试想一下如果服务器对上传的文件进行校验, 需要耗费大量的硬盘资源, 因为可能同时有很多文件进行校验, 不可能一下子就能校验完成的, 如果进行校验MD5, 硬盘可能将会忙碌于大量I/O扇区操作.
从目前主流的网盘技术出发, 一般使用的是比较先进的header check技术, 也是TCP/IP的GET头校验 (8byte), 并配合 10%左右的文件片区SHA1散列校验, 因为同一个文件在一个随机单元的重复率是SHA1 40bits*10^8, 也就是说只要有大约10%的GET头steaming校验和少量SHA1散列校验即可.
举一个比较通俗的例子, 115网盘再进行秒传的时候, 一般15G的文件能够在数秒内完成, 如果是校验本地硬盘的SHA1和服务器对比, 绝对不可能完成 (udown是完整文件校验, 不知道开发者为什么不采用网页的片区校验).

8201843
回复含违规内容
只看该作者
举报
8201843
貌似SKYdrive没有妙传功能啊。