从专业的服务器角度出发说说115云存储的详细架构
今天,我想说说一下115之类的云存储详细架构, 作为skydiive的web开发工程师, 我想把这些先进的云存储技术和大家分享分享
很多人可能会觉得云存储不过就是把文件放在网络硬盘而已, 殊不知网盘的服务商存储这些文件耗费的大量精力. 以skydrive开发为例子, 用户的网盘中文件会被微软分发到数十个数据中心, 稍微懂点电脑的, 就知道这是RAID冗余技术, 微软skydrive的RAID冗余模式是 RAID5+5+10+10+50+50+50+50, 微软的skydrive数据还被后台备份至磁带服务器. 因为硬盘的成本比较高, 而磁带能够提供大容量的备份, 比如HP的一盘商业数据存储磁带能够存满大概400GB的数据.
再来看看115网盘, 原先的115网盘有3个镜像, 应该早先用115网盘的还记忆犹新, 他们分别是电信, 网通, 备份下载. 后来改为电信下载和联通下载, 服务器优先上传至电信的服务器, 过几天以后再同步到联通服务器. 现在, 115只有一个普通下载, 以我个人看法, 因该是115简化了下载步骤, 登陆时候自动优选电信或者联通. 由于我不再国内, 只能用VPN来简要测试一下, 如果用电信线路服务器, 得到119.147.*.* 这样IP下载地址, 如果用联通线路, 能得到 112.70.*.* 这样的下载地址, 说明115确实在线路上有优化
再来谈谈skydrive的存储架构, skydrive用的是目前主流网盘流行的 CDN技术,也叫 content distribution network, 内容分发网络, skydrive在美国当地 50个洲有大约5000个节点镜像, 每个50个节点镜像互相享有他们之间的RAID分块数据. 这和115的极速下载比较类似, 都是使用了内容分发网络, 只不过skydrive对所有用户数据都进行同步, 而115的CDN可能只是一种VPN或者SSH光纤隧道, 把主站的资源通过万兆以太网发送给离用户最近的CDN节点, 算一种带宽加速CDN.
最后来说说服务器的带错运行, 所谓带错运行, 就是服务器有几块空闲的硬盘, 当有其中一块硬盘故障时候, RAID能够重新识别一块硬盘并通过奇偶校验ODC和异或校验来重建数据, 可能当时服务器忙的不可开交,没空写入, 这是这些错误块会预先写入内存中, 待空闲时候重建RAID. 和skydrive类似, 115在后台, 也会采用类似的技术, 为了保障用户的安全,可能115还会有更多的冗余镜像, 这样即使一个数据中心发生故障, 也能从另一个数据中心恢复所有数据.
-

3842231
回复含违规内容
只看该作者
举报
3842231
受教啦 ,我想115的辉煌还是要靠枫哥的思维所左右。