找回密码
 立即注册
查看: 58|回复: 0

数据词典:Scribe

[复制链接]

108

主题

1

回帖

478

积分

管理员

积分
478
发表于 2025-10-30 09:14:30 | 显示全部楼层 |阅读模式
Scribe能够从各种日志源上收集日志,存储到一个中央存储系统(NFS或者分布式文件系统等),以便于进行集中统计分析处理。它为日志的“分布式收集、统一处理”提供了一个可扩展的、高容错的方案。
ScribeFacebook开发的分布式日志系统,它使用Thrift传输日志数据。ScribeScribe AgentScribe和存储系统三部分组成。
Scribe Agent实际上是一个ThriftClient。各个数据源须通过ThriftScribe传输数据,每条数据记录包含一个Category和一个Message,可以在Scribe配置中指定Thrift线程数,默认是3
Scribe接收到ThriftClient发送过来的数据,放到一个共享队列MessageQueue,然后根据配置文件,Scribe可以将不同Category的数据存放到不同目录中并Push给后端不同的存储对象。
后端的存储系统提供各种各样的存储方式,包括filebuffer(双层存储,一个主存储,一个副存储)、Network(另一个Scribe服务器)、Bucket(包含多个Store,通过Hash将数据存储到不同Store中)、Null(忽略数据)、Thrift File(写到一个Thrift Tfile Transport文件中)和Multi(把数据同时存放到不同Store中)。
【出处】刘丽敏,廖志芳,周筠.大数据采集与预处理技术,中南大学出版社,201812月第1.

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|全数联人才测评中心 ( 京ICP备2024094898号 )

GMT+8, 2025-11-18 05:21 , Processed in 0.092859 second(s), 21 queries .

版权所有: 全数联人才测评(北京)中心

友情链接: 中华全国数字人才培育联盟 全数联人才测评中心学习平台 全数联人才测评中心存证平台 全数联人工智能专员认证中心

快速回复 返回顶部 返回列表