Title: 数据流概述 Locale: zh URL: https://sensorswave.com/docs/data-center/pipeline/overview/ Description: 了解数据流的整体功能,掌握数据导入导出管道的使用方法 数据流(Pipeline)是 Sensors Wave 的数据导出管道,帮助您将平台内采集的事件数据和用户数据定期批量同步到外部数据仓库,实现跨平台的数据统一分析。 通过数据流,您可以解决以下问题: - 如何将 Sensors Wave 中的用户行为事件自动同步到外部数据仓库,供数据团队进行二次分析? - 如何将用户画像数据定期导出,与其他业务数据进行联合查询? - 如何补充历史数据,使数据仓库中有完整的事件序列? ## 核心概念 ### 数据流(Pipeline) 数据流是一条从 Sensors Wave 到外部数据仓库的自动化数据同步通道。每条数据流对应一个特定的导出目标(目标系统中的一张表),配置完成后按指定的执行频率自动运行。 ### 连接器(Connector) 连接器是 Sensors Wave 与外部系统对接的集成类型,分为两类: - **Source 连接器**:将外部数据接入 Sensors Wave,如 Android SDK、iOS SDK - **Destination 连接器**:将 Sensors Wave 的数据导出到外部系统,如 Snowflake ### 数据源类型 每条数据流导出一种类型的数据: | 数据源类型 | 说明 | |-----------|------| | **事件数据** | 用户行为事件,按时间增量同步 | | **用户数据** | 用户画像属性,按更新时间增量同步 | ### 执行频率 数据流支持两种调度方式: - **间隔执行**:每隔固定时长(1–23 小时)触发一次,如每 1 小时、每 6 小时 - **定时执行**:在指定时区的固定时刻触发,如每天 08:00 ### 历史数据回填(Backfill) 回填功能允许您在数据流创建后补充指定时间范围内的历史数据。回填按自然日窗口串行执行,中断后可从上次完成的窗口继续,不会重复写入已完成的数据。 ## 功能概览 数据流在 **数据中心 → 数据流** 页面统一管理,您可以: - 创建事件导出或用户导出数据流 - 配置连接信息和执行频率 - 查看每次运行的状态、导出行数和日志 - 发起历史数据回填 - 查看导出指标趋势 ## 支持的连接器 | 连接器 | 状态 | 说明 | |--------|------|------| | [SDK](sources/sdk.mdx) | 已支持 | 通过客户端和服务端 SDK 将应用事件和用户数据接入 Sensors Wave | | [Snowflake](destinations/snowflake.mdx) | 已支持 | 将事件和用户数据导出到 Snowflake 数据仓库 | 后续版本将支持更多目标数仓。 ## 与其他模块的关系 - **与数据接入的关系**:数据流导出的是经过数据接入(SDK 采集或服务端 API 上报)后存储在 Sensors Wave 的数据,数据接入是数据流的上游 - **与数据字典的关系**:数据流导出的事件和属性,与数据字典中管理的埋点事件和属性保持一致 - **与数据洞察的关系**:数据流将数据同步到外部数据仓库后,您可以在目标系统中使用 SQL 进行自定义分析,作为 Sensors Wave 内置数据洞察的补充 ## 下一步 - **[导出到 Snowflake](destinations/snowflake.mdx)**:配置 Snowflake 连接,开始将数据同步到您的数据仓库 --- **最后更新时间**:2026 年 4 月 13 日