蓝驰创投投资合伙人石建平表示:当下,数据在高速积累,数据源技术非常多样,同时对数据扭转的实时性和可靠性有更高要求,企业在高效、可靠、合规和安全地管理数据方面要应对巨大挑战。「白鲸开源」能够为企业提供整体DataOps解决方案,帮助企业更好地适应大数据和云原生大时代下的数据处理与治理。团队已成功孵化了多个知名开源项目,目前已经服务了互联网、云计算、金融、运营商、先进制造业等上千家大型企业,是这些企业的核心数据管理底座。我们非常看好白鲸团队,相信白鲸具备成为DataOps领域国际知名企业的实力。
据公开信息,「白鲸开源」成立于2021年8月,由多名Apache Software Foundation Member和全球顶尖的数据领域专家组建,深耕大数据开源软件领域研发十余年,核心员工是来自IBM、eBay、Informatica、阿里、字节跳动等大数据技术的科学家和资深专家,研发人员占比超过90%,具备深厚的DataOps企业级数据调度和集成能力。
公司核心团队一直深耕于大数据和云计算领域,致力于打造下一代云原生DataOps平台,助力企业在大数据和云时代,智能化地完成自身数据的处理、调度、治理和数据资产的管理。
打造下一代云原生智能DataOps平台
在大数据时代下,海量的数据和日益复杂的数据处理需求催生了大量数据引擎公司,数据处理和使用场景也急剧增加和更复杂化。在软件开发世界中,DevOps能够高效地解决开发和运维的问题,但在人工智能时代下,当数据规模和数据源复杂度不断攀升,同时数据使用场景快速扩张时,DataOps应运而生,并成为业界与研究界的焦点。
DataOps既具备DevOps沟通开发运维的功能,还可以利用简单易用的SaaS界面、云原生、机器学习等新一代技术能力来提高企业不同角色解决数据问题的效率与分析数据的能力,快速激发了市场需求,促使其成为最前沿的技术和生产实践趋势。
作为下一代云原生DataOps平台,「白鲸开源」能够为企业提供整体DataOps解决方案,帮助企业更好地适应大数据和云原生大时代下的数据处理与治理,尤其是帮助企业快速打通企业内部数据孤岛,串联从底层数据到机器学习项目的整个生命周期。
以开源社区切入布局商业版图
在开源社区运营方面,「白鲸开源」是拥有Apache Software Foundation Member最多的创业公司,践行Apache Way,围绕开放、平等、协作的原则,建立了全球性的活跃开源项目社区。
「白鲸开源」作为Apache开源项目为依托的开源商业化公司,是下一代云原生工作流调度系统Apache DolphinScheduler以及正在Apache孵化中的数据集成平台SeaTunnel背后主导的公司。目前,金融、电信、电商、教育、交通物流、能源、云厂商、医疗、工业制造等行业超过1000家国内外企业用户在使用这两个平台,获得了用户的广泛好评。
Apache DolphinScheduler是首个由国人主导并贡献到Apache的大数据工作流调度领域的顶级项目。作为已经十分流行的开源调度项目,已有48位Committer和21位PMC,360+ Contributors 积极参与到社区的共建中。自开源以来,Apache DolphinScheduler稳步完成20+个版本升级迭代,ASF Project Statistics评分为9+,长期稳居GitHub月度趋势,并获得“2021最受欢迎项目”等各种奖项。
SeaTunnel作为Apahce孵化器的新起之秀,目前已有近100位Contributors参与到社区共建中,包括B站、滴滴、OPPO、腾讯云、Shopee、唯品会等100+家公司在生产上使用。
在持续迭代Apache DolphinScheduler和SeaTunnel的同时,「白鲸开源」还致力于打造下一代云原生的智能DataOps平台,解决企业内部云化的数据处理和调度、数据快速获取及企业整体云化数据资产的管理问题,协助完成企业数字化升级的整体目标。
「白鲸开源」已经发布了基于Apache DolphinScheduler的商业版产品——WhaleScheduler,这是一个针对企业级客户对调度系统的复杂性、稳定性、合规性和高效能等要求而开发,定位于企业级统一云原生的数据调度管理平台,致力于为企业的大数据作业制定统一的开发规范、运维方法,对各系统的作业进行统一管理、调度和监控。
WhaleScheduler七大核心功能模块
目前,「白鲸开源」已与AWS、阿里云等国内外头部云厂商达成合作。「白鲸开源」将以用户为核心,推进合作共赢的生态战略,在全新的生态商业模式和企业增长模式下,致力于和云厂商、独立开发者和系统集成商等开展合作,集成大数据领域上下游厂商,提升产品体验,探索泛互联网行业更广阔的使用场景。