淘宝云梯分布式计算平台整体架构

来源:互联网 发布:卷儿妈淘宝店怎么没了 编辑:程序博客网 时间:2024/06/09 17:36

淘宝在数据存储和处理领域在国内互联网公司中一直保持比较靠前的位置,而且由于电子商务领域独特的应用场景,淘宝在数据实时性和大规模计算及挖掘方面一直在国内保持着领先,因此积累了很多的实践的经验和产品。

框架 数据处理
商贸局的一个项目 后台融合
管控所有的行为
数据服务器分布式处理(比如:武昌一台 光谷一台)
本地服务器(两条服务器之间可以架一条高速通路)
异地服务器(只能通过网络连接)
同构 数据库和异构数据库
框架的意识 easyui bootstrop Dcloud

淘宝

系统架构
数据同步方案
调度系统
无数据应用

数据魔方 快递(物流信息)
Gateway Service
云梯

Task truk 任务流程
商品信息(oracle)
用户备库(mysql) 交易备库(sqlserver)
数据源
淘宝爬虫 热搜词 hot key
实时同步(六大数据仓库)–数据一模一样
同步备份 热备份
同步控制
带宽需要的非常高
心跳机制(数据在高速传送时,每隔10s就发送一个空包,判断连接是否畅通)
DataX–关系表(单独的购买表或者订单表)

0 0