SPVMの開発の主な目的を教えてください。
SPVMは、Perlの数値計算のパフォーマンスを改善することを目標として開発されています。数値計算と配列の演算を高速化することが第一の目標です。
仕様がほぼ確定した後にベンチマークテストを始める予定ですが、数値計算と配列の演算に対して、Perlの30倍、C言語の1/2の速度を、最初の目標としています。
C/C++のバインディングを簡単にすることが二つ目の目標です。
さらなる数値計算の高速化において必要になるのは、C/C++のライブラリをSPVMから利用できることです。専門分野のための自作のC/C++ライブラリや、openMPやSIMDやGPUを扱えるオープンソースのC/C++ライブラリをバインディングできると、数値の並列計算などでさらなる高速化が可能になります。
C言語のソースファイルを配置するだけで、C言語を記述できる機能を提供します。
設定ファイルを記述することで、gcc,clangのコンパイラオプションの制御を可能にします。ExtUtils::MakeMakerの使い方に近い記述を目指します。
SPVMのビルドディレクトリにinclude、libディレクトリを配置すれば、そこに置かれた、ヘッダーファイル、静的ライブラリ、共有ライブラリを利用できるようにします。
SPVMとC言語で、データをやり取りするための仕様化されたAPIを提供します。
すでに生成された共有ライブラリなどのバイナリファイルの後方互換性が、SPVMのバージョンアップによって、壊れないように設計されます。
単体で実行可能な実行ファイルを生成することが、三つ目の目標です。
SPVMは、実行ファイルを生成する機能を持っているので、ランタイムなしに、プログラムの実行が可能です。単体で実行可能なので配布することもできます。
共有ライブラリ(ダイナミックリンクライブラリ)の読み込みにも対応します。
ボタンなどのGUIを備えたWindowsのネイティブアプリケーション、スマートフォンで動くiOSネイティブアプリケーションが作成できるようにします。
どのような人をSPVMのユーザーとして想定していますか。
Perlは強力な文字列処理を利点として、従来より遺伝子解析などの生命情報科学の分野で利用されてきましたが、近年はデータ取得技術の革新によって利用できる遺伝子情報が爆発的に増加したため、配列操作の遅さに不満を感じている研究者の方がいます。
配列操作を簡単に高速化でき、必要であればC/C++をバインディングし、openMPやSIMDなどの並列計算ができればと考えている研究者の方を想定しています。
Perlは本当に型のない言語です。Perlは内部的には型を持っていますが、数値型と文字列型は、コンテキストに応じて、予測しづらい方法で変換されてしまいます。
Perlの整数演算はオーバーフローが発生すると、浮動小数点型に変換されます。これは、便利ですが、数値計算の結果の予測はしづらくなります。
Perlの整数演算は、コンパイラオプションによって、32bitあるいは64bitになります。浮動小数点演算は、float型を持たず、double型しか持ちません。
Perlの数値演算は正しい結果を返しますが、どの型になるかは、コンパイラオプションや内部の動作に依存し、予想がしづらいものとなっています。
SPVMは、静的型を持つ言語あり、32bitと64bitの整数演算、floatとdoubleの浮動小数点演算を区別して実行することができます。
SPVMを使うと、Perlの文法で、数値計算と配列演算を速くすることができます。
IoTの開発者は、ハードウェアからWebまでの幅広い知識が必要になります。大量の分野の知識が必要となるため、これを簡単に実現するライブラリがあれば便利です。
C/C++、アセンブラを使って、センサーのデバイスドライバを作成。HTTPクライアントライブラリを使って、Webにアクセス。開発環境で、実行ファイルを作成して、それぞれの機器にそのままコピー。このような一連の機能をSPVMは提供する予定です。
画像処理には、大量の配列演算が必要です。Perlは、配列のデータ構造を言語仕様として持たないため、不満を感じている方がいます。
SPVMは、連続した領域を持つ配列のデータ構造を提供しているので、DirectXやOpenGM、OpenCVなどと組み合わせて、画像処理をしたいユーザーに向いています。
AI・機械学習には、配列演算が必要です。Perlは、配列のデータ構造を言語仕様として持たないため、不満を感じている方がいます。
SPVMは、連続した領域を持つ配列のデータ構造を提供しているので、機械学習ライブラリとの相性が高いです。
SPVMは、JSONモジュール、非同期IOをサポートしたHTTPクライアント/サーバーをコアで提供する予定です。実行ファイルを生成可能なので、小さなLinuxサーバーを構築し、実行ファイルをコピーして、マイクロサービスを運用可能です。
SPVMは、リファレンスカウント方式のGCを採用しているので、FullGCが起こらず、非同期IOの性能に大きく関わるレイテンシを小さくできます。
SPVMは連続したデータ領域を持つ配列型を提供しています。
Perlの数値計算の弱点の一つは、型を固定して計算することができないことです。ある操作によって浮動小数点に変換されたり、文字列型に変換されたりします。SPVMでは、仕様化された数値型と計算規則を持っているので、どの型によって計算されるかを正確把握することができます。
C99で追加された新しいC言語の数学関数がすべて利用できます。
SPVMの言語仕様は、メジャーバージョンごとに、仕様化されています。仕様を元に、独自にコンパイラを開発することが可能です。
SPVMのサブルーチンはコンパイル時に、機械語へコンパイルすることができます。
SPVMの文法は覚えやすく簡単になるように設計されています。
文法の95%以上はPerlの文法を採用しています。Perlをすでに学んでいるユーザーであれば、2時間あれば、すべての文法を覚えてしまうことができるでしょう。
型の種類、型の規変換規則は、明確です。型推論は、常に右から左へ行われます。