3 月 29 日,首届 “隐语开源社区开放日” 活动上,隐私计算开源框架 “隐语” 宣布产品升级,并开源了 SCQL 功能。

SCQL 提供的简单易上手的 BI 分析,可帮助中小机构快速解决急迫的长尾数据安全分析需求,在工业界首次实现了隐私数据从 Al 分析到 BI 分析,是隐语走向易用的重要一步。

 

 “隐语” 框架负责人王磊发布 “隐语” SCQL 系统

在数据要素战略持续升级的背景下,发展以隐私计算为代表的密态技术,是解决大规模数据安全可信流转的技术手段。

由于隐私计算最早诞生于大规模数据场景,技术架构和资源投入对于小规模数据体量的机构来说相对复杂和奢侈,比如动辄百亿千亿数据规模的隐私保护机器学习,对于中小机构来说并不适用,如何简单快捷高性价比地使用隐私计算技术,提高易用性,一直是隐私计算行业待突破的技术难题之一。

围绕共建更好用的隐私计算技术和更健康的生态,“隐语开源社区开放日” 活动现场,开发者、应用方、学术专家们展开了讨论。“隐语” 开源框架负责人王磊重点介绍了 “隐语” 框架最新升级并开源的重磅功能 SCQL。这是将业界常用的隐私计算技术多方安全计算 (MPC)作为底座,以当前主流的 SQL 作为分析语言的多方安全数据分析系统GNSS系统,可让用户简单易上手地实现多方数据密态分析任务,能有效满足中小机构低成本使用隐私计算分析的需求。

隐语 SCQL(Secure Collaborative Query Language),技术要点如下:

- 以 SQL 为使用接口,基于隐语 MPC 内核 SPU 构建,支持多方联合数据分析;
- 支持虚拟库、虚拟表、用户等抽象,方便进行分项目与分表的合作项目权限管控;
- 支持字段级别的数据权限控制机制 (CCL);
- 支持上游平台集成系统 API,封装独立的产品;
- 支持常用算子:JOIN, GROUP BY, 支持聚合类函数 (sum/min/max/avg)、算术类算子 (+、-、*、/、INTDIV)、比较类算子(<、 <=、 >、 >=、=、!=)和 IN 等算子与函数;

聚焦多方数据联合分析的场景, 隐语基于 MPC 技术内核的底层抽象 SPU 设备,创新实现了一种 类 似 SQL 的 多方安全分析语言 "SCQL"。

这种语言继承了 SQL 作为常用数据分析语言的普及性、易学性和高成熟度,同时还拓展了标准 SQL 的语义,可以描述基于多个数据源的安全计算,通过 “SELECT FROM”、“JOIN ON”、“GROUP BY” 等语句的组合搭配,即可完成联合分析的统计结果生成。

具体展开:

  • 从使用与集成上: 方便接入用户的本地数据源,使用方式和体感与传统 SQL 无异,且提供简单易用的 API 接口,便于集成封装,低成本满足业务中的多方数据协同分析需求;

  • 从数据访问控制上: 利用隐语 CCL (Column Control List) 权限控制机制,参与方对数据授权的控制颗粒度可精细到「字段(列)」,在不同的场景、不同的联合项目中,可以根据不同数据字段 (列) 的价值区别,进行精准的使用与控制;

  • 从功能范围及灵活度上: 灵活支持 SQL 常用数据源,降低数据协同前的匹配成本(内置支持 MySQL,且未来还计划支持 postgres、Hive 和 csv 等数据源);支持大部分常用数据分析算子 & 函数;既支持小而快、高频率为主要诉求的在线查询,也支持更复杂、侧重业务决策诉求的离线分析 ;

  • 从计算性能上: 首个工业级多方安全数据分析系统,继承了传统数据库中 Query 下推等重要优化手段,在联合的多方数据分析中同样实现提前过滤数据、减少网络传输,降低了 MPC 计算的性能开销。

当前隐私计算在全球范围内都处于攻坚阶段,行业正在通过开源开放的方式,降低技术门槛,加速技术普及。

2022 年 7 月,“隐语〞框架正式开源,覆盖了几乎所有主流隐私计算技术路线。本次 “隐语〞开源框架升级是提升技术可用易用的又以一重要动作。隐语开源社区也将发布 SCQL 的共建任务,希望广大开发者参与进来,共同持续建设完善这一功能,共建隐私计算技术生态。


 

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐