トランスコンパイラ

コンパイラの一つ ウィキペディアから

トランスコンパイラ(他にトランスパイラ、ソース・トゥ・ソースコンパイラ、などとも)は、あるプログラミング言語で書かれたプログラムソースコードを入力として受け取り、別のプログラミング言語の同等のコードを目的コードとして生成する、ある種のコンパイラである。一般に、コンパイラが「比較すると高水準な言語のソースコード」を入力とし、「比較すると低水準な言語の目的コード」を、コンパイル結果として出力するものであったのに対し、トランスコンパイラは同じ程度の(抽象化の)水準のコードをコンパイル結果として出力する。

それらの処理系における具体的なコンパイルの処理、すなわち、入力から出力への変換において実際に行われることは、それぞれの処理系によってさまざまである。字句のレキシカルな変換やsyntactic sugar(糖衣構文)の展開といったような程度の場合もあれば、高度なコンパイラ最適化を施して機械語をコード生成するような、通常のコンパイラと全く同様の処理をおこなっているものもある。

たとえば、PascalのコードをCのコードへと変換するといったものや、「自動並列化コンパイラ」のように、見た目としては逐次的なfor文などで書かれいているコードを、OpenMPのような並列化メタデータFortranforall文のような言語構造に変換する[1]、といったものがある。

トランスコンパイルの別の目的は、基本的なプログラミング言語の次期バージョンを使う場合や、APIの後方互換性が壊れた場合などに、レガシーなコードから変換することである。プログラムの実行環境が変わる場合(例えば、Python 2からPython 3に変換する場合や古いAPIから新しいAPIに変換する場合)や、コンパイルによりプログラムのサイズが極端に大きくなったり実行速度が遅くなったりした場合はリファクタリングを行う。

トランスコンパイラは、元のソースコードの開発やデバッグを簡単に行うことができるよう、元のコードをコメントなどに残す(ことができる)ものもある。また、元のコードから変換した際に構文が大幅に変わった場合は、同等のコードには見えないようなコードに変換されることもある[2]。元のコードから変換されたソースコードにマッピングを行うデバッグツールもある。

トランスコンパイラを主たる実装として開発されている言語の例としてはClosure Compiler, Coccinelle, CoffeeScript, Dart, Haxe, TypeScript[3], Emscripten[4]がある。

歴史

ここでは1980年前後以降の例を示す。

1981年にゲイリー・キルドールによって書かれたデジタルリサーチのXLT86がある。それはIntel 8080用の.ASMソースコードからIntel 8086用の.A86ソースコードに変換した。8080のレジスターを用いた全体的なデータフロー解析を用い、出力されるコードサイズを最適化し、CP/M-80MP/M-80英語版のプログラムが自動的にCP/M-86MP/M-86に移行できるよう呼び出しを処理した。XLT86自体はPL/I-80でかかれ、CP/M-80環境のみならず、DEC VMS (for VAX 11/750 or 11/780)でも動くようになっていた[5]

似たような、しかしもっと洗練されていないプログラムは1980年86-DOSの一部としてティム・パターソンによって書かれたTRANS.COMがある。それは、いくつかのZ80アセンブラのソースコードを8086用の.ASMソースコードに変換した。しかし、これは制御コードレジスタ、モードのサブセットのみをサポートしており、かなりの手動変換や手直しを必要とした。それはレジスタやジャンプ最適化を行わなかった[6][7]

言語実装

要約
視点

いくつかの言語実装は当初トランスコンパイラとして開発され、それらの言語実装の中には2016年現在もトランスコンパイラのものもある。以下の表に加え、CoffeeScriptのメンテナがJavaScriptに変換できる言語の一覧を提供している[8]

さらに見る 変換元言語, 変換先言語 ...
変換元言語変換先言語備考
BASICCBaConを用いる[9]
BCXC
CJavaScriptEmscripten
C++Ccfrontを変換に用いる
ChapelC
ClojureScriptJavaScript
COBOLCOpenCOBOL英語版を用いる
COBOLJavaP3COBOL英語版を用いる
CoffeeScriptJavaScript
C#JavaScriptScriptSharp[10]を用いる
CythonCこのコード変換は、PythonインタプリタCPythonで使用するモジュールのコンパイルを意図している
DartJavaScript
Delphi Web Script / Object PascalJavaScriptSmart Mobile Studioを用いる[11]
ECMAScript 6JavaScriptBabel[12]もしくはtraceur-compiler[13]を用いる
EiffelC
GoJavaScriptGopherJS
GroovyJavaScriptgrooscript
HaskellJavaScriptGHCJSを用いる
HaxeJavaScript, PHP, C++, C#, Python, JavaActionScriptバイトコードのようなバイトコードの生成にも用いられる
JavaObjective-CJ2ObjC[14]
JavaJavaScriptgrooscript, GWT, JSweet, ST-JS
JavaTypeScriptJSweet
JavaCjava2c-transcompiler[15]
JuliaCJuliaの言語実装は機械語を生成し、C言語を必要としない。しかし、個々の関数やすべてのプログラムをC言語に変換することも可能である[16][17]
LESSCSS
Lisaac英語版C
Mirah英語版Java
MoonScript [18]Lua
NimC, C++, Objective-C, JavaScript
OCaml bytecodeJavaScriptOcsigen英語版プロジェクトのjs_of_ocamlを用いる
PHPC++HipHop for PHP英語版を用いる
PythonJavaScriptBrython, PyPyJs, Rapydscript, Skulpt, Transcrypt
PythonC++NuitkaとShedSkin[19]を用いる
RatforFortran
RubyJavaScriptOpal
Sass[20]CSS
SchemeCStalin compiler英語版, Chicken Scheme
TypeScriptJavaScript
ValaGObjectのような追加ライブラリを使用したC
X10C++, Java
Xtend英語版[21]Java
閉じる

コード変換

開発者が、既存コードの大部分を別の言語に変換する場合、すべてを手動変換するよりもトランスコンパイラを使用するほうがよい場合が多い。「機械的」に変換が可能なのであれば、手動変換するのは単に手数を掛けるだけ無駄なばかりではなく、手作業にはミスがつきものだからである。一方で機械的な変換が不可能な場合もまたあり、ソース言語と目的の言語の組み合わせや、実際のコード次第でもあるがケースバイケースであって、一般論としては何も決定的なことは言えない。

さらに見る ツール, 変換元言語 ...
ツール変換元言語変換先言語備考
2to3 scriptPython 2Python 32to3は自動変換プロセスはきわめて優れているが、それでも手動変換が必要となる場合はある。
EmscriptenLLVMバイトコードECMAScriptこれはC/C++バイトコードをブラウザ等で実行することを可能にする
Google Web Toolkit特別なAPIを用いたJavaJavaScriptこのJavaコードを普通のJavaコードと同等とみなすことは難しい
Ocsigen英語版のJs_of_ocaml[22]OCamlJavaScript
J2Eif[23]JavaEiffel変換時、Javaに類似したクラスと構造を持つEiffelの構文や慣習を解決する。
C2Eif[24]CEiffel変換時、可能な限りクラスと構造をきれいにしようとする。このツールは完璧であり、適切に処理できないCの組み込み関数やアセンブルを除去する。
Swiftify[25]Objective-CSwiftSwiftifyはオンラインのコード変換ツールで、主にiOSコードベースの一部または全体の移行を支援する。
閉じる

関連リンク

脚注

Wikiwand - on

Seamless Wikipedia browsing. On steroids.