基于操作系统内核eBPF开展可观测性、SRE技术研究;实现全栈智能运维解决方案(含供应链安全);面向8+2行业提供三库一平台SaaS化运维服务。 | ||
研究eBPF与Linux内核关键技术,研发eBPF uprobes用户级别动态跟踪的数据采集与安全分析工具,构建Linux操作系统和云原生的主动可观测能力。 · 拓展可观测数据指标:实现OpenTelemetry+eBPF结合,可观测程序调用、网络传输、服务黄金指标等,研究扩展观测接口和支持更多应用。 · 兼容扩展工具集:兼容主流BCC、libbpf等框架,提供灵活的扩展能力,实现支持Python、go、rust以及更多语言的开发接口。 · 跨平台和多架构支持:eBPF工具的应用迁移和适配,支持国内外主流Linux和ARM64、x86和Loongarch等架构。 · 安全扩展:研究eBPF能力扩展、安全验证和治理,实现AI技术与eBPF结合,智能探测漏洞和异常操作。 | ||
基于eBPF实现云原生可观测数据采集与运维,提供支持多种语言、统一数据格式和采集传输协议的底层可观测能力,应用于企业分布式追踪、性能指标分析和服务依赖分析等场景。 ·用户应用软件零侵入零改造:eBPF程序以本机机器指令运行,基于内核直接进行数据采集,无需侵入和改造用户的应用软件。 · 具备灵活可伸缩性:eBPF程序可以在运行时动态附加到系统内核中,无需重启目标系统,支持服务的快速可伸缩而不影响观测。 · 资源消耗占比小:eBPF在内核运行,减少了和用户空间上下文切换时间与内存占用,对系统资源消耗,较传统方法有明显优势。 ·支持容器启动、停止等变化状态:不需要任何Sidecar侵入,直接通过内核来观测任意容器的状态。 | ||
通过eBPF技术和AI赋能,构建以AIOPS为底座的,以站点可靠性工程和混沌工程为核心的故障快速恢复能力建设体系框架,实现OS+OS架构下故障的快速恢复能力,为系统稳定运行提供强大支持。 · AI+eBPF:应用人工智能机器学习方法,智能分析系统观测数据,形成云原生主动式运维的智能洞察力和智能诊断分析工具。 ·事件预测:基于人工智能的可观测系统,通过eBPF采集数据的综合分析,研究事件预测机制,实现运维监控的“先知、先觉、先行”。 · 服务快速定位:通过微服务的调用链路跟踪,快速定位异常点,实现业务抢通和修复的信息支持。 ·混沌工程:基于eBPF提高故障模拟真实度,通过知识积累和事件预测机制,提高模拟故障有效性,验证和提升服务的可靠性能力。 |