使いもしないのにC++のtemplateを毛嫌いする全ての人に
C++AdventCalendarの記事です。
さて、
生配列使ってますか?
tr1::array(boost::array)
使ってますか?
生配列使っていると答えた貴方、
→まず死ね。
はい、arrayが常識ですよね。
さて、とはいえ、
「テンプレートを使うと遅いしコードがでかいし」
「生配列が一番速いしコードが小さいし」
「なのでテンプレート禁止」
なんて話を聞くこともあるかと思いますが、
こういう事をいう人は大抵「テンプレートを書いたことがない」のに言ってます。
なぜか?
こういう人が本当に心配しているのは「テンプレートが肥大化すること」じゃないのです。
「テンプレートが書けないし読めないのを認めたくないからです」
多くはCの老害だからですが、そういう人は放っておいてC++な人はきちんとテンプレートを使いましょう。
だって多くのテンプレートのコードは大きくもなければ非効率でもないからです。
その上、デバッグ用のチェックコードも仕込まれてますし、
ちょっとしたことから大きなことまで様々なところで便利です。
とはいえ実際にアセンブリを見たことがありますか?
じゃ、やってみましょう。
gcc を使って-O5でのコードを比較します。
(Mac上でg++-4.2.1 (GCC) 4.2.1 (Apple Inc. build 5664)を使用しています)
gccでは-Sをつけることでアセンブリコードを吐いてくれるので非常に比較が楽です。
g++ -Wall -S -O5 main.cpp
でやってみました。
enum { DATA_SIZE = 10000000, }; int data[DATA_SIZE]; int hoge() { for (int i = 0; i < DATA_SIZE; ++i) { data[i] = rand(); } return data[0]; }
と、
typedef tr1::array<int, DATA_SIZE> FooArray; typedef FooArray::iterator FooArrayIt; FooArray data2; int hoge() { for (FooArrayIt it = data2.begin(); it != data2.end(); ++it) { *it = rand(); } return data2[0]; }
で比べてみましょう。
生配列は、
LFB1530: pushq %rbp LCFI6: movq %rsp, %rbp LCFI7: pushq %r12 LCFI8: pushq %rbx LCFI9: leaq _data(%rip), %rbx leaq 40000000(%rbx), %r12 .align 4,0x90 L11: call _rand movl %eax, (%rbx) addq $4, %rbx cmpq %r12, %rbx jne L11 movl _data(%rip), %eax popq %rbx popq %r12 leave ret
テンプレートでは、
LFB1531: pushq %rbp LCFI2: movq %rsp, %rbp LCFI3: pushq %r12 LCFI4: pushq %rbx LCFI5: leaq _data2(%rip), %rbx leaq 40000000(%rbx), %r12 .align 4,0x90 L4: call _rand movl %eax, (%rbx) addq $4, %rbx cmpq %r12, %rbx jne L4 movl _data2(%rip), %eax popq %rbx popq %r12 leave ret
完全に一致!
と、最適化をかけるとちゃんと一致します。(かけないと一致しません)
多くのコンパイラではテンプレートコードの最適化はかなり賢く完全に一致します。
ではタプルでは?
typedef tr1::tuple<int, int, int> TripleInt; TripleInt moo() { TripleInt t; tr1::get<0>(t) = 1; tr1::get<1>(t) = 2; tr1::get<2>(t) = 3; return t; }
と
typedef struct StructTripleInt { int one; int two; int three; }; StructTripleInt noo() { StructTripleInt t; t.one = 1; t.two = 2; t.three = 3; return t; }
これも、
LFB3381: pushq %rbp LCFI2: movq %rsp, %rbp LCFI3: movl $1, (%rdi) movl $2, 4(%rdi) movl $3, 8(%rdi) movq %rdi, %rax leave ret
と、
LFB3382: pushq %rbp LCFI4: movq %rsp, %rbp LCFI5: movl $2, -12(%rbp) movl $1, -16(%rbp) movq -16(%rbp), %rax movl $3, %edx leave ret
になり、殆ど変わらないコードになります。
コンパイラにもよりますが、最近のコンパイラは頭良いのでこの辺りは心配ないと思います。
こういった「最適化されたときにゼロコストになるテンプレート」は思いの外沢山あります。
組み込みなどで.textの肥大が辛い場合「テンプレートを使わない」という選択肢もなくはないですが、
まず「テンプレートを使わない」と決める前にきちんと自分の使っているコンパイラの吐くコードを確かめましょう。
懸念としてコンパイル速度が若干遅くなる懸念はありますが、開発の効率性や保守性を考えた時、
テンプレートを使わない、という選択肢はないと思います。
また空間や速度の効率性に関してはEfficient C++等も参考になります。
Efficient C++パフォーマンスプログラミングテクニック
- 作者: ダブブルカ,デビットメイヒュ,浜田光之,Dov Bulka,David Mayhew,浜田真理
- 出版社/メーカー: ピアソンエデュケーション
- 発売日: 2000/07
- メディア: 単行本
- 購入: 9人 クリック: 105回
- この商品を含むブログ (31件) を見る