2022年12月5日と6日の2日間に渡って、The Linux Foundationが主催するオープンソースカンファレンス「Open Source Summit Japan 2022」が横浜で開催された。リアルのイベントとオンラインイベントの併設で行われ、リアルでは約500名が参加した。同時にOpenSSF DayやELISA MINI SUMMIT、KubeDay Japan、SODACONなどがミニカンファレンスとして、続く12月7日に開催された。
開催時点の横浜では市中を歩く人々の姿からはパンデミックがやや収まった感があるが、会場では参加はマスク着用が求められ、Linux Foundationが感染の拡大に注意を払っていることが感じられた3日間となった。ただし、オープンソースに関するカンファレンスなのにIBMもRed HatもMicrosoftもスポンサーしておらず、展示ブースはやや低調だったのが残念だった。
初日のキーノートはAutomotive Grade Linux
初日のキーノートに登壇したAGLのエグゼクティブディレクター、Dan Cauchy氏
初日のキーノートにはLFのサブグループであるAutomotive Grade Linux(AGL)のエグゼクティブディレクターDan Cauchy氏が登壇し、AGLの現状などを解説した。AGLについては自動車メーカーが個別にLinuxをベースにした車載システムを開発するのではなく、オープンなソフトウェアを使って必要となる機能要件の70%から80%のコードを提供することだとして、必ずしもターンキーシステム(電源を入れたらすぐに利用できるシステム)を目指しているのではないことが語られた。
参加者の一人からはAGLについて、これまでメーカー同士が競っていた開発をオープンな形で協業しながら行うことについては、まだまだ秘密主義がまかり通っていることがAGLのハードルかもしれないと教えてくれた。この参加者は「ソフトウェアの中で使われる変数の命名規則ですら、社外には出したくないというエンジニアもいます。それが分かれば何を作ろうとしているのかわかってしまうから」とコメントしてくれたが、差別化と競争をオープンなプラットフォームを作りながら行うことの難しさが垣間見られた瞬間でもあった。
AGLの概要を紹介
Cauchy氏は車載OSのシェアの推移についても解説。中国国内で多くのEVメーカーが起業しているが、それらのメーカーではAndroidからフォークしたOSが枝分かれしてシェアを取っていたが、やや陰りが見えると説明。Linuxが減り、AGLが着実に増えていることを強調していた。
車載OSの推移を紹介。中国ではAndroidの亜流が多く流通していることを示している
他にも富士通やパナソニックオートモーティブシステムズなどのリーダークラスの社員が登壇し、それぞれ社内のオープンソース活用事例やAGLをベースにした車載システムについての解説を行った。
パナソニックオートモーティブシステムズ社のプレゼンテーションでは車載システムの統合、コンテナー化、仮想化、そして複数のSoC(System on a Chip)で実行されるLinuxやAndroidアプリなどについて解説が行われた。
複数のSoCで実行されるLinuxやAndroidのアプリが車載コンソールに表示される仕組みを解説
OSPO
またエンタープライズにおいてITの資産にオープンソースが使われるのはすでに当たり前だが、自社が利用するオープンソースソフトウェアの拡大とそのための土壌作りという意味でOSPO(Open Source Program Office)を作るのが欧米ではトレンドとなっているのを受けて、TODO Groupがセッションを行った。
OSPOのセッションを行うTODO GroupのAna Jimenez Santamaria氏
社内のオープンソース利用のための組織としてOSPOを作って加速させるという方法がある程度確立されているのは妥当だが、「別組織として立ち上げる以上はKPIが明確に定義されている必要があるのではないか? TODO Groupはユースケースからそういう情報は得てないのか?」という質問をしたところ、具体的な回答がなかったのは残念だった。
Sigstore
またクラウドネイティブなプラットフォームとしてすでにデファクトスタンダードとなっているKubernetesを電子署名のため利用するSigstoreに関するセッションも行われた。
Sigstoreの概要が紹介された
SigstoreのセッションはOpenSSF Dayの一部として実施された。セッションを担当したのはGoogleのBob Callaway氏だ。
Kyverno
またKubernetesに特化したポリシーエンジンのKyvernoについてもセッションが行われた。
Kyvernoのセッション
エグゼクティブディレクターJim Zemlinは2日目キーノートに登壇
Linux FoundationのエグゼクティブディレクターであるJim Zemlin氏も2日目のキーノートに登壇。ここでは新しいプロジェクトの概要やチャレンジについて解説を行った。
Jim Zemlin氏のキーノートセッション
2022年の総括として新たに加わったプロジェクトや配下の組織について説明し、ソフトウェアだけではなくハードウェアやオープンデータ、さらにオープンな仕様についても領域を拡大していることを説明した。その上でソフトウェアのサプライチェーンにおいて、まだ問題が存在すること、ロシアによるウクライナ侵攻を背景にしながらテクノロジーに関してもナショナリズムの姿が見え隠れしていること、リセッションによって企業からのオープンソースコントリビューターへの支援が弱まっていることなどをチャレンジとして挙げた。
Chainguard
2日目はChainguardの創業者兼CTOのDan Lorenc氏、Linux FoundationにおけるエンベデッドシステムのVPを務めるKate Stewart氏なども登壇した。
ChainguardのDan Lorenc氏
AI実装に必要なデータに関するライセンス問題
この記事の後半では、モダンな人工知能を実装するためには必須となるデータに伴うライセンスに関するセッションを紹介する。これはHuaweiのエンジニアであるGopi Krishnan Rajbahadur氏が行ったもので、セッションのタイトルは、「OpenDataology – A Call to Arms for Fixing the Dataset Licensing Landscape」だ。動画は以下を参照されたい。
●参考:OpenDataology – A Call to Arms for Fixing the Dataset Licensing Landscape
セッションを行うRajbahadur氏
タイトルに「A Call to Arms」とあるようにデータの利用について「武装」しようと言うタイトルだが、パブリックなデータについても実際には商用利用については制限がついてくることがある、クリエイティブコモンズで公開されていたとしても法的リスクが発生する可能性があることなどについて、解説を行っている。
ソースコードがオープンとなっている場合に、ライセンスがGPLなのか他のPermissiveなライセンスなのかについてはデベロッパーであれば注意を払うだろう。しかし自分が開発した機械学習が利用するデータについては、単にクリエイティブコモンズのライセンスであれば問題なしと安易に考えることは危険だというのがこのセッションのポイントだ。
CC-SAだけでは人工知能に使われるデータセットとしては危険
実際にパブリックに公開されているデータであっても商用利用が許可されていないものがあるケースや、処理の途中で発生する元データから生成されたデータについてもライセンスの適用範囲になる場合があるなど、厳密にチェックを行っていない段階でも多くの不明点があることを指摘した。
このスライドだけ覚えて欲しいと強調したスライド
「データライセンスは恐ろしい」というこのスライドだけでも覚えて帰ってくれと力説したRajbahadur氏だったが、Linux Foundation AIのサブプロジェクトとして発足したOpenDataologyはまだ新しいプロジェクトであり、多くのコントリビュータを求めているとして参加者に訴えてセッションを終えた。
OpenDataologyについては以下のポータルでライセンスの検索などがすでに立ち上がっている。
データについてもライセンスが付与され、そのライセンスには許可されている範囲と義務が必ず付いてくる、それを確認せずに単に公開されているからと利用し、問題が発生してから慌てるよりも、必ず準備をして欲しいというのがこのセッションが啓蒙したいテーマだった。
ブース、併催のミニカンファレンス
ブースやKubeDay Japan、SODACONについては以下の写真を参照して欲しい。
AGLのブース
SODACONのスライド。Open Data Frameworkの紹介
KubeDay Japanのバナー。トップスポンサーはNew RelicとYahoo! Japan
盛り上がるKubeDay Japanのセッション。多くの参加者で賑わっていた
毎年12月はOpen Source Summitが日本で開催というのが定例になってきた。特にAGLとサプライチェーンセキュリティについては定点観測を行っていきたいと思わせるカンファレンスとなった。