
第3章 开源企业概览
3.1 国际化标杆企业
3.1.1 早期开源企业
1. IBM
IBM是软件商业化的先驱,它开创性地将软件和服务从硬件业务中分离出来,并推出了首个软件许可协议,从而奠定了软件市场的商业模式基础。IBM不仅塑造了软件产业的发展轨迹,还成功地将软件服务转变为公司的主要盈利渠道。
在路易斯·郭士纳的领导下,IBM在20世纪90年代后期开始大力推广采用Linux操作系统的低成本服务器。随着时间的推移,IBM不断深化其对开源的承诺和策略,逐渐成为全球开源软件和硬件运动的重要参与者和领导者。
IBM的开源历程充满了如下里程碑式的事件。
● 对Linux操作系统的接纳与支持:IBM做出了一个战略性的决策,全面支持Linux操作系统。这一举措是IBM向开源转型的重要转折点。IBM投入了大量资源来开发和优化Linux内核,使其更加适应企业级计算环境,包括对大型服务器平台的支持。
● 开源工具与技术推广:2001年,IBM推出了Eclipse项目,这是一个开源的集成开发环境,极大地推动了跨平台应用程序开发工具的标准化。除了Eclipse以外,IBM还积极参与了多个Apache项目,通过贡献代码和工程师资源,对Hadoop、Spark等关键项目作出贡献。
● 开源建设和内部转型:IBM逐步改变了其内部研发模式,鼓励员工积极参与开源项目,并将内部技术逐步开源。同时,IBM调整了其知识产权策略,显著增加了对开源社区的专利授权,以支持开源项目的发展。
● 开源云计算与容器化:IBM加入了Cloud Foundry Foundation,支持PaaS(Platform as a Service,平台即服务)的开源项目,帮助开发者更轻松地构建、部署和管理云原生应用。此外,IBM还支持Docker容器技术及其生态系统,并成为Kubernetes项目的重要贡献者。
● 大规模收购:2019年7月,IBM完成了对Red Hat的收购,这笔价值340亿美元的交易标志着IBM在开源领域的又一重大投资。
● AI与数据科学开源:IBM在人工智能领域开源了多个项目,包括免费的机器学习平台Watson Machine Learning Community Edition和云服务模型Deep Learning as a Service(DLaaS),这些项目为数据科学家和开发者提供了强大的工具和资源。
2. Red Hat
自1993年成立以来,Red Hat一直致力于为Linux操作系统提供专业的商业支持和服务。通过企业版Linux产品,Red Hat重新定义了操作系统的商业化模式。Red Hat的开源解决方案涵盖混合云基础架构、中间件、敏捷集成、云原生应用开发,以及管理和自动化等领域。自从被IBM收购后,Red Hat获得了IBM强大的企业资源的支持。
Red Hat的开源历程充满了如下里程碑式的事件。
● 推出Red Hat Linux发行版和企业版:1995年,Red Hat推出了自己的Linux发行版,即Red Hat Commercial Linux,这是Red Hat的第一个稳定版本。随后,Red Hat不断推出升级版本,以满足市场的需求。2002年,Red Hat发布了面向企业的Linux操作系统——Red Hat Enterprise Linux 2.1 AS(Pensacola),并持续每年更新,直至2024年5月推出了Red Hat Enterprise Linux 9.4,展现了其在企业级Linux操作系统市场的持续领导力。
● 通过收购布局中间件和云:2006年6月,Red Hat收购了开源中间件供应商JBoss,这一举措不仅扩展了Red Hat的产品线,也加强了其在中间件市场的地位。同年,Red Hat推出了集成JBoss技术的Red Hat Application Stack,进一步巩固了其在企业级应用开发和集成领域的影响力。2012年和2014年,Red Hat分别收购了云管理软件厂商ManageIQ和云计算服务提供商eNovance,展开了在云计算领域的战略布局和扩张。
● 为开发者推出云平台OpenShift:2011年,Red Hat推出了OpenShift,这是一个为开发者设计的云平台,提供了一系列工具和服务,可以帮助他们构建、部署和扩展应用程序。2013年,Red Hat支持Docker开源项目,推动了容器技术的标准化和普及。2015年,随着OpenShift v3的推出,Red Hat进一步明确了其在容器化和云原生技术领域的发展方向,确立了Linux、容器和Kubernetes作为项目的核心基础。
● 被IBM收购后仍保持独立运营:2019年,Red Hat被IBM收购,这一事件标志着Red Hat进入了一个新的发展阶段。在IBM的支持下,Red Hat不仅能够利用IBM庞大的商业网络和客户资源,还保持了业务的独立性,继续在开源领域发挥独特的价值和影响力。
3. Netscape
网景通讯公司(最初名为Mosaic通讯公司)是美国的一家知名计算机服务企业,其开发的网景网络浏览器(Netscape Navigator)一度在市场上占据领导地位。然而,在互联网早期的浏览器大战中,网景通讯公司面临着激烈的竞争,尤其是与微软的IE浏览器等对手的竞争。
面对竞争压力,网景通讯公司采取了一项具有里程碑意义的举措:开源其浏览器的源代码,并在此基础上组建了Mozilla社区。
网景通讯公司在开源历程中的标志性事件如下。
● 推出开源浏览器项目Mozilla:1998年1月,网景通讯公司做出了一个划时代的决定,将其Netscape Communicator浏览器软件免费提供,并开源其源代码,这个项目被命名为Mozilla。这一举措不仅为Mozilla项目吸引了全球众多开发者和志愿者的参与,而且形成了一个充满活力的社区,共同推动了浏览器技术的发展。
● 成立Mozilla基金会:2003年,为了确保Mozilla项目的长期发展和独立性,网景通讯公司的母公司AOL宣布将Mozilla项目转移到一个新的非营利组织——Mozilla基金会。这一举措为Mozilla项目提供了稳定的支持,使其能够更加专注于技术创新和社区建设。
● 推出Mozilla Firefox浏览器:2004年,Mozilla社区推出了Mozilla Firefox浏览器。这是一款由社区驱动的开源浏览器,Firefox浏览器的推出,标志着Mozilla项目从开源社区走向市场的成功转型。此外,Mozilla基金会还孵化了众多开源技术,如Rust语言、JavaScript、Gecko引擎等。
3.1.2 新世纪以来的开源企业
1. Google
Google的开源历程是一段充满创新与合作的旅程。自公司成立之初,虽然Google并未立即成为开源运动的中心力量,但随着其业务的扩展和技术需求的日益增长,Google逐渐认识到开源在推动技术创新、促进技术传播以及构建活跃社区方面的重要作用。
随着时间的推移,Google开始积极投身于开源项目和活动,其贡献不仅限于资金和资源的支持,还包括技术专长和开发者的积极参与。
Google的开源历程是其技术创新和社区贡献的重要体现。以下是Google开源历程中的一些标志性事件。
● 初期开源贡献:尽管Google最初并未将开源作为核心策略,但自21世纪初以来,它就开始对一些开源项目作出贡献,例如对Python语言的持续支持和改进。
● 推出Android Open Source Project(AOSP):2005年,Google收购Android项目,并于2007年开源了这一操作系统。Android项目的目标是提供一个开放、免费的移动操作系统平台,允许任何人查看、下载和修改源代码。在苹果推出智能手机的初期,Android成为唯一可以与iOS竞争的操作系统。智能手机市场的快速增长,加上众多手机制造商对智能终端操作系统的需求,使开源的Android迅速成为全球流行的智能手机操作系统之一。
● 开源Kubernetes:2014年,Google将内部已经运行多年的集群管理系统Borg的设计理念和技术实践开源,并命名为Kubernetes。Kubernetes提供了自动化的部署、扩展以及管理容器化应用的能力,使开发者能够专注于构建应用程序,而无须担心底层基础设施的复杂性。Kubernetes发布后迅速获得社区的广泛支持,为容器技术的发展提供了新的动力。为了推动Kubernetes的发展并确保其开放性,Google将该项目托管至CNCF。
Google还开源了许多其他有影响力的项目,包括但不限于Chromium、Closure Library、Guava、Protocol Buffers、Go语言、AngularJS、Flutter、QUIC、TensorFlow等。其中,Go语言和TensorFlow等项目因其广泛的应用而备受瞩目。同时,许多著名的开源项目,如Hadoop,也受到了Google发表论文的启发而选择开源,进一步推动了大数据技术的发展。
2.微软
微软的开源历程是一个从保守到拥抱的转变故事,它展示了一个行业巨头如何适应技术变革并最终成为开源领域的重要贡献者。
在开源运动的早期,微软作为商业软件的领军企业,对开源软件持有一定的保留态度。公司曾将开源,尤其是Linux操作系统,视为对其商业模式和市场地位的潜在威胁。
随着21世纪的到来,移动互联网、云计算、大数据等技术的兴起使开源软件在技术行业中的重要性日益增加。微软逐渐认识到,与开源社区合作,采用和贡献开源技术对于维持其产品的竞争力和技术领导地位至关重要。
2007年,微软迈出了战略转变的重要一步,首次加入开放源代码促进会,这一行动标志着微软对开源态度的积极转变。
在随后的几年中,微软不仅开始积极参与各种开源项目,还逐步将其内部的一些关键技术开源,以促进更广泛的技术交流和合作。
近年来,微软的开源贡献变得更加广泛和深入,该公司在GitHub上的贡献度位居前列,开源了包括.NET Core、Visual Studio Code、TypeScript等在内的多个重要项目。此外,微软还收购了GitHub,进一步强化了其在开源社区中的地位。
以下是微软在开源领域的一些具有里程碑意义的事件。
初期开源贡献:2006年,微软推出了CodePlex,这是一个代码托管平台,旨在为开源项目提供托管和共享服务,尽管该平台在2017年关闭,但它标志着微软对开源社区的初步贡献。2008年,微软发布了ASP.NET MVC框架,并将其许可为开源项目,这是微软在开源领域的又一重要步骤。
纳德拉推进开源进程:2014年,萨提亚·纳德拉成为微软CEO后,微软宣布将.NET框架开源,并将其移植到Linux和Mac OS X平台上,这一举措极大地扩展了.NET的生态系统,并促进了跨平台开发。
2015年,微软发布了Visual Studio Code,这是一个功能强大的开源代码编辑器,由于其支持多种编程语言和开发环境,迅速成为开发者社区中的热门工具。与此同时,微软的云计算平台Azure整合了开源技术,支持多种开源操作系统(如Linux)、数据库(如MySQL、PostgreSQL)、容器技术(如Docker、Kubernetes)等。同时微软积极参与相关开源社区的建设与发展。
2018年,微软以75亿美元收购了全球最大的代码托管平台GitHub,这一举措不仅强化了微软在开发者社区中的影响力,也体现了其对开源承诺的坚定。
创建基金会:微软创建了.NET Foundation等开源基金会,以支持开源项目的健康发展和社区的协作。
3. Meta
Meta(原Facebook)作为全球领先的社交媒体平台和技术公司,一直是开源社区的积极参与者和重要贡献者,Meta的开源项目覆盖了多个技术领域,包括前端与移动端开发、后端服务、数据库、人工智能、数据分析、基础设施、编程语言、开发工具等。
Meta在开源领域的发展史是技术创新和社区贡献的典范。以下是Meta(包括Facebook)在开源历程中的一些标志性事件。
关键开源项目:2013年,Facebook将内部项目React开源,这是一个用于构建用户界面的JavaScript库,极大地改变了前端开发的方式。基于React,Facebook推出了React Native,这是一个跨平台移动应用开发框架,允许开发者使用JavaScript编写原生移动应用,进一步扩展了React生态系统。2015年,Facebook推出了GraphQL,这是一种用于API(Application Programming Interface,应用程序接口)的查询语言和运行时环境,提供了更高效、灵活的数据获取方式,允许客户端精确请求所需数据,减少冗余传输。2016年,Facebook人工智能研究院基于Torch推出了PyTorch,这是一个广泛使用的开源机器学习库。2018年,Facebook推动PyTorch应用普及,使其成为增长速度极快的开源项目之一。此外,Facebook还推出了React VR、Create React APP、Flow、Docusaurus、Horizon等开源框架和工具,进一步丰富了开发者的工具箱。2011年,Facebook联合多家科技公司发起并成立了Open Compute Project(OCP)开源硬件组织,公开了服务器、存储、网络设备等设计规范,推动了数据中心硬件行业的创新与标准化。
关键开源大模型项目:Meta在AI大模型上的开源动作成为近期业界关注焦点。2024年4月,Meta发布了开源大模型Llama 3,该模型具有80亿和700亿个参数的预训练和指令微调,支持广泛的应用场景。Llama 3在超过15万亿的token上进行预训练,相较Llama 2的训练数据集大了7倍。Massively Multilingual Speech(MMS)是Meta推出的开源语音技术项目,为超过1100种语言提供了语言转文本(语音识别)和文本转语音(语音合成)服务,且支持大量未标记口语数据,推动了多语言语音技术的发展。
4. AI大模型下的开源
OpenAI,作为人工智能领域的一支新兴力量,因其开发的先进语言模型而在全球产业界引起了广泛关注。自2015年成立以来,OpenAI一直致力于通过开放的研究和合作来推动人工智能技术的发展,并确保其安全、负责任地被应用。
在GPT-2项目初期,OpenAI出于对潜在滥用的担忧,限制了模型的开放获取。但在2019年11月,OpenAI最终开源了GPT-2语言模型的完整版本,这一举措体现了其对社区开放性和透明度的承诺。对于后续的GPT-3项目,OpenAI选择通过API提供模型的使用,而没有公开其源代码。
虽然公司名称中有Open一词,但在大型模型是否开源的问题上,OpenAI采取了较为谨慎的策略,以防止技术被滥用。不过,OpenAI也开源了一些与AI大模型相关的项目,影响比较大的有Whisper(一种自动语音识别模型)、Gym(用于开发和比较不同强化学习算法的工具)和CLIP(基于对比学习的大型图文预训练模型)。
Mistral AI,成立于2023年4月,是一家在人工智能领域迅速崛起的新兴企业。该公司推出了备受瞩目的Mixtral 8x22B模型,并已将其开源——包括源代码、模型权重、训练数据集(若有的话)及详尽的使用指南和接口文档。这一举措使全球的研究者、开发者和企业都能够自由地访问、下载、使用、修改和重新分发这些资源。Mistral AI还开源了其他几个大型模型,如Mistral 7B和Mistral Large 2,进一步巩固了其作为全球极具影响力的人工智能初创公司之一的地位。
Technology Innovation Institute(TII),位于阿联酋首都阿布扎比,是一个专注于多个技术领域的科研中心。在人工智能领域,TII展现了其广泛的研究兴趣,并且开源了几个关键项目,其中最为人所知的是Falcon系列的大语言模型。为了进一步推动开源生成式人工智能模型的发展,TII还成立了Falcon Foundation,这标志着其在推动技术创新和开放合作方面的决心。
放眼全球,开源的商业探索起初是由IBM和Red Hat等先锋企业所引领的。进入21世纪,众多新兴的互联网科技公司逐渐崛起,成为推动开源在商业领域发展的核心力量。随着大模型技术的兴起,这些新兴科技公司有望为开源事业注入新的活力和创新精神,进一步拓展开源技术的边界和应用前景。