あなたが1972年のDennis Ritchieに憑依できたとしたら、C言語のここだけは変える！というところは何ですか？

Question

Miyata Akira · Accepted Answer

C言語のポインタについてのモヤモヤが解消した印象深い思い出があります。

ン十年も前、まだ中学生か高校に上がったばかりの頃だと思います。当時、ほぼ定期購読していたマイコン雑誌があって、ある号から私にとって革命的な連載が始まりました。

その頃は8ビットCPUのZ80やMC6800などで組んだ自作ハードウェアに16進でマシン語をちまちま打ち込んでいた時代です。そんな時、「自作のハードウェアなんてもう卒業しよう！これからはプログラミングを楽しむ時代だ！」と銘打った企画が登場したのです。

連載テーマは、当時少しは知られるようになったC言語のコンパイラの製作です。Cコンパイラ（のサブセット）をC言語でコーディングしていくのです。私にとって、実質的なプログラミングキャリアのデビューは、連載されたC言語のソース（しかもコンパイラという得体のしれない代物が相手）をひたすら熟読C言語を学びながらコンパイラの作成技法を学ぶことでした。

でも結果的にはそれが正解だったのです。

C言語のポインタを学んだ頃に抱いた疑問・誤解、およびそれらを克服するきっかけは何でしたか？に対するOgawa Kiyoshiさんの回答 [ https://jp.quora.com/C-gengo-no-pointa-wo-gaku-n-da-goro-ni-hou-i-ta-gimon-gokai-oyobi-sorera-wo-kokufuku-suru-kikkake-ha-nande-shita-ka/answers/185779125 ] でも似たような経験が語られていますが、特定のプログラミング言語に精通したければそのプログラミング言語の処理系（コンパイラ、インタプリタ）の中身を勉強するに限るということです。

ちょっと、その時のAh Hah!体験をシェアしてみたいと思います。

C言語の学習者にとってポインタは鬼門と言われています。特にポインタと配列とが混淆していることが問題で、初心者に限らず、次の3つの宣言文が何を宣言しているのかについては中級者でもすぐには答えられません。

[code]int **a;      // (1)
int *b[3];    // (2)
int (*c)[3];  // (3)
[/code]正解は、

* (1)の "int **a;" は、aという名前(変数名)の変数を宣言しており、
 * 
 * その型は、intオブジェクトへのポインタへのポインタ

* (2)の ”int *b[3];" は、bという名前(配列)の配列を宣言しており、
 * 
 * 配列サイズは3で、
 * 各要素の型はintオブジェクトへのポインタ

* (3)の ”int (*c)[3];” は、cという名前(変数名)の変数を宣言しており、
 * 
 * その型はサイズ3のintオブジェクトの配列へのポインタ

図で書くと、こんな感じです。黄色で塗りつぶした部分が宣言対象のオブジェクトで、それらには変数名や配列名が付けられています。

では、これがコンパイラの中身とどのように関係しているのでしょうか？

カギは、「C言語の演算子の優先順位」と「Cコンパイラが内部生成する構文解析木データ」にあります。

まずは、演算子の優先順位について。

C言語では、式中での配列の添字演算子［］はポインタの間接参照演算子＊よりも優先度が高く、宣言文でも同じ優先順位に従います。（）を使って、優先関係を明示的に表せば、以下のようになります。

[code]int **a;      // (1) →  int *(*a);
int *b[3];    // (2) →  int *(b[3]);
int (*c)[3];  // (3) →  int (*c)[3];
[/code]次に、コンパイラについて。

Cコンパイラの前半部の処理は、C言語のソースコード（テキストファイル）を読み込み、C言語の文法に基づいて構文解析を行い、内部に構文解析木データを構築することです。後半処理では構築した構文解析木データの意味を解釈し、マシン語に翻訳します。

宣言文に対応する構文解析木データを作成するアルゴリズムは非常に単純です。ポインタと配列が絡む部分だけを抜き出せば、次の２つのルールだけです。

[code]ルール1: T | *x;    ⇒ {pointer-to {T}}  | x;
ルール2: T | x[n];  ⇒ {array[n]-of {T}} | x;
[/code]矢印（⇒）の左側のパターンが現れたら右側のようなパターン（＝構文解析木データ）に置き換えるのです。なお、縦棒（｜）は型指定子（＝型情報）と宣言子（＝宣言対象）とを区切るための便宜上の印です。

実際に、例(1)で試してみます。まず、ルール1を適用すれば以下の通り。

[code]// (1) int **a;
int | *(*a);  ⇒ {pointer-to {int}} | *a;
[/code]再度、ルール1を適用して

[code]{pointer-to {int}} | *a;  ⇒ {pointer-to {pointer-to {int}} | a;
[/code]縦棒（｜）の右側が識別子（名前）だけになれば、構文解析木データは完成です。読んで字の如く、aが「（int へのポインタ）へのポインタ」であることは明白です。

例(2)(3)も同様です。それぞれ、以下の通りです。

[code]// (2) int *b[3];
int | *(b[3]); ⇒ {pointer-to {int}} | b[3];
{pointer-to {int}} | b[3]; ⇒ {array[3]-of {pointer-to {int}}} | b;
// (3) int (*c)[3];
int | (*c)[3]; ⇒ {array[3]-of {int}} | *c;
{array[3]-of {int}} | *c; ⇒ {pointer-to {array[3]-of {int}}} | c;
[/code]縦棒（｜）をイコール（＝）と見做すと、まるで方程式を解いていくような感覚です。実際にもコンパイラ内部ではこのような処理を行なっているわけですが、人が紙の上で行うことも簡単です。英語が分かれば、何が宣言されていて、その型が何なのか一目瞭然でしょう。

もっと複雑な宣言文も、丹念に方程式を解いていけば、いずれ解が得られます。

逆もまた然りで、こういう型のオブジェクトを宣言したいと思ったら、逆方向にパターンを書き換えていけばよいのです。

こうしたことを、コンパイラのソースを読みながらはたと気がついた次第です。

まぁ、こういった経緯もあってか、私はポインタの悪夢からは早ばやと卒業しました。もちろん、マイコン少年として、ハードウェアやアセンブリ言語の知識もそれなりに持っていたので、そのことも助けになった部分はあります。

実は白状すれば、ポインタはもう大丈夫なんですが、const や volatile などの型修飾子が結構厄介で、目下の頭痛のタネになっています。

Anonymous · Answer

配列がポインタに自動変換され、添字アクセスがポインタへの算術演算を通じたアクセスと等価と定義し、同じもののように扱える、というアイデアを捨て、普通に別のものとして扱うようにする。

この仕様は、配列の範囲外アクセスチェックをするような言語拡張を事実上不可能にし、char,char*が日常的に使わなければならない「文字列」でもあると同時に「任意のバイト、バイト領域を扱えるオールマイティ」という高危険度データ型と不可分同一、という仕様とあいまって、「安全な文字列操作を、並みの人間では長期的にはほとんど不可能にする」という結果を招き、今となっては凄まじいクソ仕様というしかありません。現代でもバッファオーバーフロー攻撃による脆弱性の発見が後をたちませんが、元凶はほとんどここらへんと言っても差し支えないと思います。

まあ、当時はネットワークを通じた攻撃という概念がほとんどなかった頃なので、まさしく後知恵ですが、時空を越えた憑依ということで。(畏れ多い！)

もちろん、C言語は紛れもなく素晴らしい発明であり、人類文明に多大な貢献を果たしたことは、感謝と共に申し添えておきます。

* C言語において配列はなぜ波括弧で表示するのですか？角括弧のほうがもっとしっくりくると思いますがに対するQuoraユーザーさんの回答 [ https://jp.quora.com/C-gengo-nioite-hairetsu-ha-naze-nami-kakko-de-hyouji-suru-no-desu-ka-kaku-kakko-no-houga-motto-shikkuri-kuru-to-omoi-masu-ga/answers/162985116 ]

松本 光一 (Koichi Matsumoto) · Answer

creat 関数を create にする…というのは、Ritchie の言ったジョーク(?)ですが、PDP シリーズの乏しいリソース、容量が小さくて遅いハードディスク、今時のプリンタなど比較にならない低速のテレタイプ I/O コンソール、ということを考えると、何を提起しても馬鹿げていると一蹴されたかなと思います。

int がマシンによって 16ビットになったり 32ビットになったりしたのは、PDP シリーズや VAX シリーズとの互換性を考えるとやむを得なかったことですし、当時の低速な PDP では、32bit 値を扱うのはコストのかかる、つまり遅い処理になってしまっていたためです。じゃあ int16 とか、int32 を導入すれば、という意見もあるようですが、そうすると、UNIX のポータビリティが失われるのでデメリットしかなかったのです。また、BCPL のサブセットとしての B 言語、その発展としての C 言語を考えると、1ワードが必ずしも 8ビットや 16 ビットとは限らなかった当時のコンピュータを考えればビット数の規定はむしろ邪魔と言われたと思います。

また、配列の添え字チェックをしないとか配列とポインタの互換とかは当時としては苦肉の策で、チェックを入れたり分離したりすればただでさえ遅いマシンに遅い処理系が走ることになって開発者としては認められなかったでしょう。

Hideki Ikemoto · Answer

当時の事情を考えると大きく変えるのは難しいと思いますが、一つだけ挙げるならswitch文の仕様ですね。後世の言語にもこの仕様が引き継がれているものがあるので。

https://ja.m.wikipedia.org/wiki/Switch文
breakを入れないと次のcaseに行くのですが、breakの入れ忘れによるバグが発生しがちです。

なのでデフォルトでbreak、あるいはcase文の最後にbreakやreturnを入れないとコンパイルエラーにする、それなら出来そうかなと。

Anonymous · Answer

直接走るコードを書けるからです。

PythonとかJavaとかが動くようにするためには、それを走らせる環境が必要で、順当に考えるとOSが載るような物が必要になる。　組み込みの一部にはOSが乗っていますが、小規模なデバイスはOSが無く、直接コードが走る必要があります。
　OSが要らず、プログラムがコンパクトで速ければ安いデバイスで済むわけです。
　例えばちょっとした製品に、OSが走る300円の32bitの高性能ARMマイコンではなく、30円の16ビットマイコンにすれば原価が大幅に下がります。　プログラム開発に多めのコストを吐き出したところで、1台1台の製品を作るときには270円ずつ安くなり1万台で270万円安くなります。　更に、小規模なデバイスは電源や周辺制御、基板や実装コストも安くなるのでこの価格差は拡大します（OSが動くようなチップは大抵BGAという実装で多層基板が必要ですが、小規模な物なら1層でもなんとかなるし両面程度で十分になる）
　ソフトウェア製品は、ソフトだけ売れば良くネットの時代になって量産コストがほぼ皆無だから開発コストだけ気にすれば良いが、組み込みは対象の製品を作れば作る分だけ材料の代金がかかる。

コンパクトなLinuxが動くボード

Linuxをそれなりに動かすなら、これの中央にあるMPUと左にあるメモリチップくらいは必要。　そして、それの電源やクロック回路等が上下と更に裏面に並んでいる。 　左のUSBと右のLANは不要なら外せるが、それを切り詰めても半分くらいのサイズは残る。　メモリは512MB等で、クロックは1GHz等。　しかし、メモリもCPUの計算能力もOSにだいぶ持って行かれる。

直接走るコードを動かすならこんなボードで出来る

大きいのがMPUで内部にメモリも持っていて、外部には電源とかが少しあるだけ。さっきのLinuxボードの右上にあるチップがこのMPUと同じサイズ。　数十MHzの計算コアと、数百KBのプログラムフラッシュと数百KBのメモリがチップの中に収まっているのでCで書いたコンパクトなプログラムはそれを全て独占し、チップ1個で完結出来る。

Ichi Kanaya · Answer

型チェックも組み込みの文字列型も多重インクルードを防止するディレクティブもなくて構わない．そういう時代だった．

だがセミコロン，てめぇだけは駄目だ．セミコロンはデリミタじゃなくてセパレータであるべきだったんだ． [1]

1. C言語でint型変数2個を互いに入れ替えるマクロはどのように書きますか？に対するIchi Kanayaさんの回答 [ https://qr.ae/TWpKsS ]

Naoto Yoshioka · Answer

検索しやすい言語名にする。

taturou · Answer

関数定義を func で、変数定義を var で始めるようにします。

func main(void): int {

var n: int = 0;

return n;

}

こうすればパーサー書くのがとても楽になるので。

最近の言語は、みんなこんな感じですよね。

Morihiro Kato · Answer

わかりやすく、と言うならば。

表計算（Excelなど）で例えてみます。

Excelを使用する時、何気なく使っているセルにも必ずA1やA2などのアドレスが存在していることと似ています。

例えば、A2セルに=A1と入力すれば、A1セルの値がA2セルにも表示されます。

これはポインタ変数にアドレスを入れているのと似ています。

[code]#include %3Cstdio.h%3E

int main(void){
	int A1;
	int *A2;
	A1=9999;
	A2=&A1; //excelでいうところの、=A1と同じ。
	
	//%d 数字を表示、A2はポインタ型なので不可能
	printf("A1 value:%d
",A1);
	//printf("A2 value:%d
",A2);できない。
	
	//%p Addressを表示、A1はint型なので不可能
	//printf("A1 value:%p
",A1);できない
	printf("A2 value:%p
",A2);
	
	//%p Addressを表示、両方可能
	printf("A1 address:%p
",&A1);
	printf("A2 address:%p
",&A2);
	
	//%d pointerを表示、A1はint型なので不可能
	//printf("A1 pointer:%d
",*A1); できない。
	printf("A2 pointer:%d
",*A2);
	
	return 0;
}
[/code]結果は以下のようになります。

[code]A1 value:9999
A2 value:0x7fff53919838
A1 address:0x7fff53919838
A2 address:0x7fff53919830
A2 pointer:9999
[/code]0xではじまるのが実際のアドレスです。

よく見るとA1とA2のaddressの末尾が若干異なっています。

(3行目と4行目です。)

0xで始まるアドレスをExcelのアドレスに置き換えると以下のようになります。

[code]A1 value:9999
A2 value:A1
A1 address:A1
A2 address:A2
A2 pointer:9999
[/code]まとめ：

ポインタを理解するときは、Excelに当てはめれば視覚化されてわかりやすくなるかもしれないです。

理解の助けになったら幸いです。

Hantani Sadahiko · Answer

逆にポインターはなぜ必要なのかを考える方が早いかも知れません。

コンピューターのプログラムはメモリに書き込まれて動いています。

BASICなどのプログラムは使う人がメモリを意識しません。どのメモリーのアドレスに保存されていても気にしないわけです。

ただし、C言語はそれでは困るのです。例えば下の方に書いてある「H/8 IO領域」というのはメモリ上に配置されたコンピューターを制御する特別なメモリです。読んだり、書いたりすることでCPUを制御できます。

メモリの値を直接読んだり、書いたりできるようにしたのが「ポインター」です。

例えばメモリの0xFFFF10に0xFFを書き込まないといけない場合、

char *a; とポインター型変数を宣言します。　ポインターとはアドレスを代入できる変数なのです。

a=0xFFFF10; とポインターにアドレスを代入します。

*a = 0xFF; と書くことで、アドレス0xFFFF10に0xFFを書くことができます。

char a;

char *b;

と宣言した時、aと*bが同じように変数として扱えます。

a=10;とした時

アドレス　値

0000　　　00

0001　　　00

0002　　　10 ←a

0003　　　00

0004　　　00

変数a にはアドレスと値の２つの情報があります。

変数bは*bと書けば値、bと書けばアドレスを保存できます。

b=0003;

とbにアドレスを入れて

*b=20;

と代入すると

アドレス 0003に20が入ります。

アドレス　値

0000　　　00

0001　　　00

0002　　　10 ←a

0003　　　20←*b

0004　　　00

&を使うと、アドレスを調べることができます。

&aは0002になります。

b=&a とするとbのアドレスは0002になります。

その状態で*b = 30;とすると変数aの値を書き換えれます。

アドレス　値

0000　　　00

0001　　　00

0002　　　30 ←a ←*b

0003　　　20

0004　　　00

・・・

例えばメモリーを配列だと想像してもらうと、アドレスというのは配列の添え字になります。

char MEMORY[1000000];という大きな配列があると思ってください。

char *y; とポインターを宣言すると

*yというのはMEMORY[y]の配列の添え字を操作するイメージです。

y=100;

*y=10;

a = *y;

というのは、

y=100;

MEMORY[y]=10;

a=MEMORY[y];

と同じことです。

「*」は「MEMORY[　]」の省略だと思ってください。

凄くイメージ重視の説明ですが。

Takizawa Hiroshi · Answer

Cのセミコロンは文の終わりの記号ですが、せっかくなのでプログラミングでのセミコロンの歴史に関して以下の記事を参考にしながら考えてみたいと思います。

https://betterprogramming.pub/a-brief-history-of-the-8efda9dde2b8
英語でのセミコロンの意味ですが、コンマ(,)より強くピリオド(.)より弱い文の区切りだそうです。

https://allabout.co.jp/gm/gc/471930/
上のサイトで例文として

I went to the library; Jonathan went to the theater.

「私は図書館に行き、ジョナサンは劇場に行った」

が挙げられていてセミコロンの前と後ろは独立の文で、しかも関連が強い場合に使うようです。

さてプログラミングの話に進めましょう。

世界で初めての高級言語はFORTRANと言われています。

初期のFORTRANではセミコロンは使われていません。基本的には１行一文です。

FORTRANのプログラムはパンチカードにパンチして計算機に入力していました。

By ArnoldReinhold - Own work, CC BY-SA 3.0, File:Punched card program deck.agr.jpg - Wikimedia Commons [ https://commons.wikimedia.org/w/index.php?curid=16041053 ]

これが一つのプログラムでカード一枚がFORTRANの一文です。（注：写真の最初の一枚はFORTRANではなくJCLとよばれるもので、この一群のカードはFORTRANのプログラムですとOSに伝えるためのものと思われます。）

カード一枚で一文なので文（ステートメント）の終わりと特別な記号で表す必要はありません。

カード一枚で収まりきれない文をどうするかという疑問が湧くと思いますが、そのときは「継続行」仕組みで対処します。

実際のプログラミン作業ですが、カードにパンチしたプログラムを連続用紙に印字してもらって机上デバッグをします；机の上のプリントアウトを見て間違いを見つける作業です。下の写真はまさにFORTRANプログラムのプリントアウトです。

実際のFORTRANプログラムのコードはこんなものです。

この方式はIBMの８０桁のカードを前提とした仕様です。

まず作ってしまうアメリカに対して、理論的な基盤、規格にこだわるヨーロッパを中心に合理的な言語の規格として提案されたのがALGOLという言語です。

ALGOLは入力機構とは独立にプログラムを記述できる言語を目指して規格を作りました。当然言語としての書法はかなり英語の影響を受けています。紙に英文を書くようにプログラムを記述できるということです。

１行一文方式だと１行の情報量が少なく、１行に複数の文を記述することを想定し、最初の英文の例のセミコロンを着想したのではないでしょうか。

1960年のALGOL60という規格で文の区切りとしてセミコロンが導入されました。ALGOLは、FORTRANとは異なり文法理論に則った構文となっています。コンピュータサイエンスを学ばれた方はBNF（バッカス・ナウア記法）という文法を記述する記法をご存知だと思います。BNFはALGOLの構文を記述するために発案されたものです。このバッカスはFORTRANの開発者のジョン・バッカス [ https://ja.wikipedia.org/wiki/%E3%82%B8%E3%83%A7%E3%83%B3%E3%83%BB%E3%83%90%E3%83%83%E3%82%AB%E3%82%B9 ]のことです。彼もALGOLの委員でありヨーロッパ中心といってもアメリカを含めた当時の一流の研究者、技術者が策定した規格です。

ALGOL60のその後の手続き型言語とコンピュータサイエンスに多大な影響を与えています。

以下がALGOL60のコードの一部分です。

[code]FOR i := 0 STEP 1 UNTIL 999 DO 
BEGIN 
	IF candidates[i] # 0 THEN 
	BEGIN 
		write(1,i); 
		text(1," is prime*N") 
	END 
END;
[/code]５行目にセミコロンが使われていてwrite文とtext文の区切りとして使われています。

余談になりますが私の大学院時代の指導教官の清水留三郎先生は日本で初めてALGOLのコンパイラをインプリメントした人です。

1960年代にセミコロンを採用した言語にIBMのPL/Iがあります。PL/IはFORTRAN,COBOL,ALGOLの機能を包含しようとした野心的なプログラミング言語です。

PL/Iのコードの一部を示します。

[code]    DO I = 1 TO LENGTH(INPUT_TEXT);
       HUO0 = SUBSTR(INPUT_TEXT,I,1);

IF HUO0 = ' ' THEN DO;
            HUO1 = ' ';
          END;
          ELSE DO;
            HUO1 = ASCII_TO_CHAR((CHAR_TO_ASCII(HUO0) + ENCRYPT_KEY));
          END;

SUBSTR(OUTPUT_TEXT,I,1) = HUO1;
        /*PUT SKIP LIST('I = ' || I);*/
    END;
[/code]この例で注目してもらいたいのはENDの前の文です。ENDの前の文にも全てセミコロンがついています。ALGOLは文の「区切り」としてセミコロンを使っているためENDの前の文にはセミコロンがついていません。PL/Iではセミコロンを文の終端の必須のマークとして使っています。

ここで改行を終端としないメリットを考えてみたいとおみます。

PL/Iの例を一部を編集してみました。

[code]     ELSE DO;
          HUO1 = 
　　　　　　ASCII_TO_CHAR(
　　　　　　　(
                 CHAR_TO_ASCII(HUO0)
                    + 
                 ENCRYPT_KEY
               )
　　　　　　);
     END;
[/code]一つの文を改行して読みやすくすることができます（好みの問題もありますが）。

C言語（１９７２年）はALGOLとPL/Iから影響を受けていてセミコロンを文の終端としています。

C言語が文の区切りではなく文の終端としてセミコロンを使ったのはコンパクトなコンパイラーをつくるためです。

ALGOLのBEGIN, ENDを { }にしてしまったのもC言語です。

Cの仕様とコンパイラがシンプルであったこと、さらに米国の独禁法の関係からUnixに含まれるかたちでCのソースコードが無償で公開されたことによりCが現在のITに多大な影響を与えます。

C言語とUnixは多くの大学や研究所のマシンに移植され活発にさまざまなソフトウェアがCで開発されました。インターネットのプロトコルスタックのほとんどはCで記述されています。プログラミング言語を開発するための様々のツールもCで開発されています。最初のWeb技術は、C言語にオブジェクト機能を追加したObjective Cで開発されています。

この有名なプログラムもC言語とともに広がりました。

[code]#include %3Cstdio.h%3E

main( )
{
  printf("hello, world
");
}
[/code]C言語はQuoraをはじめ皆さんがよく見るスマフォのアプリやWebのアプリを作るためには最適とは言えません。現在、Pythonをはじめ様々言語やフレームワークが利用できますが、それらはC言語で記述されたさまざまなソフトウェア資産（人材も含む）の上に作られていることを忘れないで欲しいと思います。

Kengo Nakajima · Answer

詳細な歴史をものすごく簡略化して言うと、C言語は、UNIXオペレーティングシステムをアセンブリ言語で書く作業が人間にはつらすぎるという問題を解決するために、アセンブリ言語を置き換える最良の言語として作られました。また、アセンブリ言語は、マシン語(0と1のビット列)を直接入力する作業が人間にはつらすぎるという問題を解決するために、マシン語を置き換える最良の言語として作られました。

つまり置き換えは、マシン語%3Eアセンブリ言語%3Eいくつかの言語%3EC言語　という感じで進んできました。C言語も完全ではないため、C言語の次の置き換え候補も、当然、さまざまな人が考案しています。

C言語の問題点を解決しようとする言語は、List of C-family programming languages - Wikipedia [ https://en.wikipedia.org/wiki/List_of_C-family_programming_languages ] を参照するまでもなく、たくさん派生しています。C++,C#,Java,Go,JavaScript,Rust,Ruby,PHP,Python,Perl など、現在広く使われている多くの言語が、C言語の派生言語です。このリンク先には、Go言語がないですね、驚きです！しかしGo言語を作った人たちは、Go言語はC言語の問題を解決する言語だと主張しています。

さて、C言語から派生したこれらの言語のなかで、JavaやJavaScriptやC#,PHP,Python,Rubyなどの言語は、C言語の機能のうち、システムプログラミングのための機能、つまり指定したメモリアドレスに直接アクセスしたり、マシン語を直接生成して実行したりする機能を捨ててできなくすることで、生産性と安全性を高めました。そのため当然ですが、ハードウェアを直接操作するプログラム(OSなど)を作りたい場合には、こうした言語は不向きです。しかし反対に、GUIアプリケーションやゲーム、Webサーバなどを作るときには、C言語よりも少ないコード量で、安全なプログラムを早く作ることができます。現在ではアプリケーションの用途は多岐に渡るので、用途ごとに特有の課題をうまく解決する言語が乱立するようになりました。

C言語以外でシステムプログラミングが全くできないということはありません。C言語から派生した言語の多くが、C言語で書かれた外部モジュールを読み込んで使えるように実装されています。C言語のシステムプログラミングの能力をこうした外部モジュールを経由して利用することができます。ただし、オペレーティングシステムのように、プログラムほとんど全体でシステムプログラミングが必要であるようなプログラムの場合は、外部モジュールを用いた実装方法は明らかに向いていません。

現在、オペレーティングシステム(OS)を実装することができるC言語の派生言語で有力なものは、Go言語とRust言語です。特にGo言語が突出しています。

Go言語を用いてOSを作ろうというプロジェクトはいくつかありますが、ソースが小さくて読みやすいものを紹介します:

achilleasa/gopher-os [ https://github.com/achilleasa/gopher-os ]

Go言語はアセンブリ言語で書かれたモジュールを読めるようになっているので、OSのブートストラップのところだけアセンブリで書かれていますが、それ以外はすべてGoで書かれています。ブートストラップのところは厳密に正確なマシン語が必要であるため、C言語で書かれたOSであっても、Cからアセンブリ言語のモジュールを読むように実装されています。

また、ls,cp,rm,ln,cat,shなど、UNIXの重要な要素である、基本ツール群もCで書かれていますが、それらすべてをGoで書き直すプロジェクトがあります。ソースがC版とどう違うのかを見ると楽しめるでしょう。

ericlagergren/go-coreutils [ https://github.com/ericlagergren/go-coreutils/network ]

Anonymous · Answer

「偉い」とか great と言うのが、そもそも「どういう事」なのか、よく分かりませんが、

よく分からないなりに言うと(汗)、

「かなり偉い」

と私は思います。

なぜなら、現在よく使われているプログラミング言語のほとんど（※１）、および OS のカーネルは（※２）、C で書かれているからです。

もし C が無かったとしたら、それらの多くは、今なおアセンブリー言語で書かれていたでしょう。

あるいは C に代わり得る別の言語がいずれ出現したでしょうが、C が 1972年に出回ってから、Rust [ https://japan.zdnet.com/article/35193491/ ] が出るまで、50年近く掛かってしまった事を考えると、やはり C は偉大な発明だったと思います。

C の「偉さ」に比肩し得るのは、C で作られなかった言語達、つまりアセンブリー言語、FORTRAN、COBOL、PL/I、ALGOL、Pascal、あたりではないでしょうか。　彼らにとって「偉い」のは機械語であり、アセンブリー言語ということになるでしょう（※３）。

しかし彼らは、C ほど多くのモノを作り出すには至りませんでした。　私の私的な感覚ですが、C 以前と C 以降では——こういう言い方が適切なのかどうかよく分からないのですが——、プログラミングに対するプログラマーの取り組みと言うか姿勢と言うか哲学と言うようなものが、大きく変わった、という感じを持っています。
これは UNIX OS の影響が大きかったという事も有るかと思います。　インターネットも UNIX が無ければ発達しなかったでしょう、つまり C が無ければ……（C は UNIX を書くために作られた）。

ところで、こうした「低層な観点」とは別に、やたらと偉い言語が１つあります。

LISP です。

先述した、「プログラミングに対するプログラマーの哲学」に、LISP は C に劣らず強い衝撃と影響をもたらした、と私は思います。　※１で引用した記事 [ https://atmarkit.itmedia.co.jp/ait/articles/2204/13/news040.html ]における「不動の第１位」は JavaScript ですが、LISP 無くして JavaScript は生まれなかったでしょう。

JavaScript が今やどれほど偉いのか、それは説明を要しますまい。　LISP の血を受け継ぎ、C/C++ で書かれた JavaScript が、「不動の第１位」である事を考えると、C と LISP の偉さが、なんとなく分かるような気がします。

※１　正直言って、私はこのリンク先記事で言及されている 20言語 [ https://atmarkit.itmedia.co.jp/ait/articles/2204/13/news040.html ]のソースコードを見た事は無いのだが、これらの９割が C か C++ で書かれているだろう事には千円くらい賭けてもよい。

※２　「OSの開発にC++よりもCが使われていることが多い理由は何ですか？」における Kurimoto Shingo 様回答 [ https://jp.quora.com/OS-no-kaihatsu-ni-C-yori-mo-C-ga-shi-ware-te-iru-koto-ga-ooi-riyuu-ha-nani-desu-ka/answers/303027643 ]に付けられた Takahashi Takahashi 様コメント [ https://jp.quora.com/OS-no-kaihatsu-ni-C-yori-mo-C-ga-shi-ware-te-iru-koto-ga-ooi-riyuu-ha-nani-desu-ka/answers/303027643 ]に、C が使われる理由が簡潔に書かれている。

※３　Pascal コンパイラーを Pascal で書いた実例が有るそうなので、Pascal はこれらの中ではやや別格——つまり「少し偉い」——かも知れない。　FORTRAN や COBOL で自言語コンパイラーが作れないとは言えないが、面倒過ぎて挑戦者が現れないであろう。

Ogawa Kiyoshi · Answer

C言語のポインタを学んだ頃に抱いた疑問・誤解と克服

1. C言語規格の意味がコンパイラを書いてみるまでわからなかった。コンパイラを書いてみるとC言語規格の未定義、未規定、処理系定義が、プログラマの精神に基づき、規格がないCPUの発展を妨げない範囲で、自由にプログラムが書けるようにするものであることがわかった。

http://www.open-std.org/jtc1/sc22/wg14/www/docs/C99RationaleV5.10.pdf

* Trust the programmer.
 * Don’t prevent the programmer from doing what needs to be done.
 * Keep the language small and simple.
 * Provide only one way to do one operation
 * Make it fast, even if it is not guaranteed to be portable.
2. 自分の書いたコンパイラが、メモリ管理がずさんで、デバッグモード以外は暴走する。静的検査、MISRA Cなどの規則に基づいて検査するとかなりメモリ周りの不具合が取れそう。

3. CPUが16bitから32bitになってメモリの管理方法が複雑になり、わけがわからなくなった。複数のOSを同時に利用できるようになり便利になったので原理は理解できていなくても大丈夫。

まとめ

C言語のポインタはアセンブラを書けばわかる。知識は不要。アセンブラで書かない処理をC言語のポインタで書くのは、無理筋。ポインタがわからないのではなく、書こうとしている処理がわかっていない。

CコンパイラかOSを書いてみれば、いかにCPUを効率的に使うための言語であり、CPUまわりの記述をするための道具であることがわかる。アプリを書くための道具ではない。

C言語のポインタが難しいのではない。難しいことをポインタで書こうとするのが間違いだと気がつけばよい。

C言語のポインタなど文法から学ぼうとするのが無理で無駄。コンパイラ、OSなどのC言語で書かれているものから学べばよい。

Anonymous · Answer

自分のブログ URL を１つ書けば済むのですが、Quora では「宣伝や商業目的でQuoraユーザーたちを外部サイトへ誘導」する回答はスパムと見なされるので、そのブログ内容を自分で（ここの回答向けに適宜編集して）再掲します。

１．はじめに

C のポインタが「難しい」と言われる理由はいくつかありましょうが、大まかに言って次の３つの理由からだろうと私は考えています。

（１）C におけるポインタの文法が変な書き方で分かりにくい。
（２）分かりやすく書かれた書籍が非常に少ない。
（３）他の言語ではポインタが使われないように見えるので、何のために使うのかが分かりにくい。

本回答では（３）に重点を置いて説明します。　誤解が無いように書くと長文になってしまうのですが、ゆっくり読めば、全く難しくありません。　必ず分かるという自信を持って、あせらず、ゆっくり読んでみてください。

２．ポインタとは、そもそも何者なのか

ポインタ（pointer）という言葉は point-er ですから、「指し示す者」と訳せます。　猟犬にポインターという犬種がいますが、あれは、仕留めた獲物の場所を教えてくれるので、そういう名前になったのです。

C のポインタも、それに似ています。　C のポインタとは、何かを指し示すための型、変数です。

一体、何を指し示すのか……それは、「メモリ（memory）に格納されている何か」です。

「何か」は、int型変数の場合もありますし、char型変数だったり、配列だったり、あるいは何らかの構造体だったりします。　場合によっては関数だったりします。　これら「メモリに格納されている何か」達を、総称して「オブジェクト（object）」とも呼びます。

関数は実行出来るオブジェクト、定数やリテラル（即値）は参照しか出来ないオブジェクト、int型変数は整数を格納するオブジェクト、float型変数は浮動小数点数を格納するオブジェクト、ポインタ変数は「オブジェクトを指し示すオブジェクト」、なのです。

では、C で扱うオブジェクト（変数・定数・即値・関数）が置かれている「メモリ」とはどういうモノか……それは「同じ大きさの小箱を、たくさん一列に並べた」ようなもので、それぞれの小箱にアドレス（address）という整数値の通し番号が付けられています。　C プログラム上においては、この小箱１つのサイズは１バイトであり、それは char型サイズと同じである事が、C の規格で決まっています（実際のコンピュータのメモリが、たとえ１ワード１４ビットであろうが関係なく、C のメモリの小箱１つは１バイトです）。

あるオブジェクトが、小箱いくつ分のサイズなのか（何バイトなのか）は、そのオブジェクトの型（type）によって決まります。　float型なら４つで char型なら１つ、などです（char型以外の型サイズは、処理系依存です）。

１つの型は、メモリ上で連続した小箱に置かれます。　float型が、２つの小箱と、別のところにある２つの小箱に分断される事はありません。　また、配列は全要素が連続した小箱に置かれます。　従って、オブジェクトの先頭アドレスを使えば――それがどんなに大きなサイズであっても先頭アドレスだけで――、それを指し示す事が出来ます。

（オブジェクトが、複数のオブジェクトの組み合わせから成る場合、それらがメモリのあちこちに分散する事は普通にありますが、「最初の・先頭オブジェクト」の型１つは、やはり連続した小箱に置かれます）

ポインタは、対象が置かれているメモリ領域の「先頭アドレス値と型を格納する」ことによって、対象オブジェクトを指し示します。　アドレス値と型があれば、対象のオブジェクトがメモリの「どこにあり」「どこまであるのか」が分かるからです。

たとえて言えば、ポインタとは、「住所を書き留めるための小さな紙きれ」のようなものです。　「東京都千代田区1-1」という住所を、小さな紙切れに書いて机上に置いておいたり、コピーしたり、誰かに渡す事は簡単に出来ますが、「皇居そのもの」を机上に置いたりコピーしたり誰かに渡すなんて事は、まず不可能です。

「皇居オブジェクト」そのものを扱うのは大変ですが、「皇居の住所オブジェクト」は、簡単に扱える……住所（address）という概念は、素晴らしいと思いませんか？

なお、C のアドレス値は整数なのですが、ポインタは整数型ではありません。　ポインタは対象オブジェクトの型情報も持つからです。　また、ポインタ変数が持つアドレス値の具体的な値は、特殊な場合を除き、気にする必要はありません。

（ポインタがどういう仕組みなのかは処理系依存であり、printf( ) 関数の出力変換書式 %p でアドレス値を表示する際の出力形式も、処理系依存です）

３．基本的な文法

ここでは、C のポインタにまつわる、基本的な３つの書き方、「宣言」、「アドレス取得」、「参照」について触れます。

３．１　ポインタ型変数の宣言

ポインタ型変数を宣言するには、次のように書きます。

[code]int * a; /* 「int型領域を指すポインタ型変数」 a を宣言 */
char * b = "ABC"; /* 「char型領域を指すポインタ型変数」 b を宣言 */
[/code]型名の後ろにポインタ宣言子の * が有る変数宣言は、「ポインタ型変数」宣言です。　指定した型の領域のアドレス値に限り格納できる変数が、この宣言後に使えるようになります。　ポインタ型変数は、単にポインタとも呼びます。

上記例のポインタ a は、int型領域しか指し示すことが出来ません。　他の型の領域のアドレスを設定すると、コンパイル・エラーになります。　ポインタは型情報を持つからです。

（なお、文字列の初期化には特別な決まりがありますが、ここでは割愛します）

「皇居のたとえ」で言えば、住所をメモするための紙切れを用意したり、すでに住所が書かれている紙切れを用意する、というのが、この「ポインタ型変数の宣言」です。

型に void を指定すると、「特に決まった型を指さないポインタ」が宣言されます。　void * 型ポインタは、キャスト（型を強制的に読み替えること、あまり推奨はしません）によって、様々な型の領域を指し示す事が出来ます。

[code]void * c; /* 「指す領域の型を特定しないポインタ」 c を宣言 */
[/code]３．２　アドレス取得

単項アドレス演算子 & を使うと、その対象オブジェクトが占有しているメモリ領域の先頭アドレス値が得られます。　「単項」というのは、マイナス符号のように、「相手が１つだけ」という意味です（= とか / は、２つの相手が要るので、２項演算子です）。　以下のように使います。

[code]int d = 365; /* 「int型の領域を占有し整数を格納する変数」 d を宣言 */
a = &d; /* a には d の先頭アドレス値が入る */
[/code]上記例で、&d は、変数 d のアドレス値、すなわち d の「住所」を示しています。　変数 a は int型専用ポインタですから、int型のアドレスである &d が代入出来ます。

「皇居のたとえ」で言えば、皇居の住所を調べるのが、アドレス演算子の役割だ、と言えます。

３．３　参照

ポインタに格納されたアドレス値そのものを見ても、そのアドレスに格納されているモノ自体については全く分かりません。　「東京都港区赤坂2-3」という住所だけ見ても、そこに何があるか、何が建っているか、誰がいるかは分からないのと似ています。

何らかのアドレス値を格納しているポインタに、単項参照演算子 * を付けると、対象としているアドレスの内容値、つまりメモリの内容が得られます。　この参照演算子 * は、ポインタ宣言子の * とは、全く意味が違う「別物」です（これは混乱を招く文法だと思います……）。　以下のように使います。

[code]printf( "%d
", *a ); /* 参照した内容値 365 が表示される */
*a = 123; /* 参照した内容値が書き換えられる */
printf( "%d
", d ); /* 書き換えられたので 123 が表示される */
[/code]「参照」とは、「皇居のたとえ」で言えば、「東京都千代田区1-1」と書かれた紙片を見て、その住所へ実際に出かけてみるようなものです。　変な・架空の住所が書かれていたり、白紙だと困ってしまいます。　* で参照されるポインタには、あらかじめ何らかのアドレス値が入っていなければなりません。

上記の例で示した「参照先の書き換え」は、たとえて言えば「住所が書かれた紙片を見て、その住所にある建物を建て替える」ようなものです。

４．局面その１「そのモノ自体を持ち回りたくない！」

ここからは本回答の本題、ポインタの「使いどころ」について説明します。

「メモリ上にある int や char や struct や配列は、その変数名で直に示せるじゃないか、わざわざポインタで示さなくても」……と思いませんか。

ポインタで書けるプログラムは、配列でも書けたりしますし、配列の方が分かりやすい感じがします。　一体、どんな時にポインタを使いたくなるのでしょうか。

関数の外側で宣言した変数は、どこからでも変数名でアクセス出来ますので、ポインタの出番は無さそうです。　１つの関数の中だけで使う変数も、同様に、ポインタの出番は無さそうです（アルゴリズムの都合でポインタにしたい場合はあるかも知れませんが）。

……ということは、ポインタが役に立ちそうなのは、「関数の中で宣言した変数・領域を、別の関数で使いたい時ではないか」、と予想出来るのではないでしょうか。

呼び出し元の関数が持つ値や、宣言した変数（の内容値）を、別の関数で使いたい時は、引数として渡す事が出来ます。

引数のある関数を呼び出す時、C では呼ぶ側の実引数の内容値が、呼ばれ側の関数の仮引数にコピーされます。　int型の引数なら４ないし８バイト、char型の引数なら １バイト、必ずコピー動作が入るのです。

実用的なプログラムでは、そこそこ大きな構造体や配列を、関数の間で持ち回りたい、という事が、よくあります。

しかし、関数の引数に構造体や配列を書くと、関数を呼び出す度に、大量のコピー動作が発生してしまいます。　１回や２回程度なら許容範囲かも知れませんが、ループの中で関数呼び出しが有ったりすると、処理時間がそれだけ掛かります。

そこで、呼ぶ側で「持ち回りたい領域」の先頭アドレスを用意して、これを引数として関数を呼ぶ、という事が考え出されました。　アドレス値を渡すので、受け取る側の関数は、仮引数をポインタ型にしなければなりません。

呼ばれ側で、ポインタに * を付けて参照すれば、目的の領域を扱う事が出来ます。

ポインタのサイズは、多くの場合、４～８バイトに過ぎませんが、ポインタ１つで、数百、数千、数メガバイト、それ以上の領域を「持ち回る」事が出来ます。

「大きな領域を持ち回る」関数呼び出しが「何回も行われる」場合、ポインタを使う場合と、使わない場合とでは、処理速度が大きく違ってくる……これは、「ポインタを使うと速い」と言われる理由の１つです。

５．局面その２「そのモノ自体を動かしたくない！」

int a[ 100 ]; という配列があったとして、その内容を昇順に並べ替える（ソート（sort）、ソーティング（sorting））プログラムというものを、C を学ぶ人は、１度は見たり作ったりする事でしょう。

ソートでは、配列要素を比較する動作と、入れ替える動作が必要になりますが、要素の型が int であれば、入れ替えは単純に代入演算子 = で済みます。

では、これが int a[ 100 ] ではなくて、下記のようだったら、どうやって入れ替えれば良いでしょうか。

[code]struct mydata { /* 構造体 mydata */
    char c; /* メンバ c */
    int n; /* メンバ n */
    float f[ 100 ]; /* メンバ f[ ] */
};
struct mydata a[ 100 ]; /* これがソート対象 */
[/code]「代入先 = 代入元 とせずに、memcpy( 代入先, 代入元, sizeof( struct mydata ) ) で入れ替える」。

……正解です。　正攻法です。

しかし、もし struct mydata が巨大であれば、正攻法では処理時間が長くなってしまいます。　また、処理時間の見積もりも、struct mydata の大きさに依存して変わってきます。

こういう場合にも、ポインタの出番です。

まずは、struct mydata a[ 100 ] の他に、ポインタの配列 struct mydata * ap[ 100 ] を用意します。　そして、ソートする前に、あらかじめ ap の各要素に a の各要素の先頭アドレスを設定しておきます。

[code]int i; /* あらかじめ宣言しておく */
～
/* ソートの前準備 */
for ( i = 0; i %3C 100; i ++ ) {
    ap[ i ] = &a[ i ]; /* a[ i ] の先頭アドレスが ap[ i ] に格納される */
}
[/code]比較は、a[ ～ ] 同士を直で比較しても良いですし、*ap[ ～ ] で a[ ～ ] の内容値を参照して行っても構いません。

そして「入れ替え」は、memcpy( ) を使わず、下記のように行います。

[code]struct mydata * workp; /* あらかじめ宣言しておく */
～
/* 入れ替え開始 */
workp = ap[ 入替先 ];
ap[ 入替先 ] = ap[ 入替元 ];
ap[ 入替元 ] = workp;
/* 入れ替え終了 */
[/code]この場合、入れ替え１回で発生する代入動作は、workp への代入、ap 同士の代入、workp からの代入、この３つです（32ビットシステムでは、大抵 12バイト分のコピーに過ぎません）。　そして、対象の構造体が、どんなに大きくても、このコピー量は一定です（ここが大事です）。

ソートが終わって結果を表示する時には、ap[ ～ ] に * を付けて「参照」したものを使います。

[code]for ( i = 0; i %3C 100; i ++ ) {
    printf( "%d
", ( *ap[ i ] ).n ); /* メンバ n を表示してみる */
}
[/code]これは、「指し示すもの（ポインタ）」だけを入れ替えて、「指し示される対象（実データ）」は全く動かさないという、C では定番のテクニックです。　こうすれば、対象データの量にかかわらず、入れ替えの処理速度が一定かつ高速になります。　これも、「ポインタを使うと速い」と言われる理由の 1つです。

ちなみに、上記の printf( ) は printf( "%d
", ap[ i ] -%3E n ); とも書けます。　-%3E はアロー演算子と呼ばれ、左辺がポインタの時のみ使える、構造体メンバを指定するための演算子です。

α-%3Eβ は ( *α ).β と等価であり、構文糖（syntax sugar）に過ぎませんが、アロー演算子を使うと、左辺がポインタである事を明示出来ます。　以下のように使い分けられています。

α-%3Eβ　…　αはポインタ、βはメンバ

α.β　…　αは構造体の実体、βはメンバ

６．局面その３「複数の値を関数の引数でやりとりしたい！」

先ほど書いた通り、C では、引数付きの関数を呼び出す際、実引数（呼ぶ側の値）から仮引数（呼ばれ側の変数）へ値をコピーします。　つまり、引数の値のやりとりは、「呼び出し元→呼び出し先」の一方通行しかありません。

呼び出し先の関数から返してもらいたい値が１個だけなら return 文で返せますが、複数個を返したい場合、これでは困ってしまいます。

ここでも、ポインタの出番となります。

複数の値を関数間でやりとりしたい、しかもそれらを引数にしたい、という場合は、呼ばれ側の関数の仮引数をポインタ型にしておきます。

呼ぶ側では、やりとりしたい対象のアドレスを実引数として渡します。　そのアドレス値は、呼ばれ側の仮引数――ポインタ型です――にコピーされます。

呼び出された側の関数では、何らかの結果を、その仮引数変数（ポインタですのでアドレス値が入っています）を「参照」した場所に設定します（ * 演算子を使う）。

この「参照」した場所とは、もちろん、呼ぶ側の関数で用意された「対象」が置かれているメモリ領域です。

こうすれば、戻り値が２つあろうが３つあろうが、いくらでも、好きな個数だけ、やりとりする事が出来ます。

時系列で書くと、以下のような動作になります。

・呼ぶ側で、結果の欲しい対象領域を用意する（いくつでも良い）。

・そのアドレスを取得して実引数とし、目的の関数を呼び出す。

・そのアドレスが、呼ばれ側の関数の仮引数にコピーされる。

・呼ばれ側の関数では、仮引数を * で参照したところに結果を設定する。

（まさにこの時、呼び出し元の関数の「結果の欲しい対象領域」の内容が書き換わる）

・呼ばれ側の関数が終了し、呼び出し元の関数に戻る。

・すでに「欲しい結果値」は得られている。

これも C でよく使われる定番テクニックですが、呼ぶ側で構造体を用意しておいて、そのポインタを引数として渡す、というテクニックもしばしば使われます。　構造体の中には多くの内容を詰め込めるので、実用的なテクニックと言えます（実装は局面その１「そのモノ自体を持ち回りたくない！」と同様ですが、目的が違うわけです）。　このテクニックをさらに突き詰めて発展させると、クラスベースのオブジェクト指向に近いものになります。

７．応用局面「大きさがよく分からないモノを扱いたい！」

「何らかの実体を扱うにおいて、その実体に触れず、その先頭アドレスを扱う」ポインタ……その重要な「使いどころ」の１つが、これです。

たとえば、ネットワーク通信で、外部からいくつものパケットを受信するプログラムを作る、とします。　そのパケットは、固定長のヘッダと、可変長の内容から成っていて、ヘッダには内容の長さが含まれているとしましょう。　また、通信相手は、同時に最大 1000カ所まではさばける仕様である、とします。

パケット内容長は、0 だったり 1 だったりする事もあれば、100 だったり１万だったりする事もあります。　こういう場合、内容を格納しておくための領域は、どう宣言すれば良いでしょうか。

[code]char packet_content[ 1000 ][ 10000 ];
[/code]……泥臭い実装ですが、これは正しい解です。　１万バイト以上のパケットについては、ヘッダ内の内容長をチェックして受け付けないようにすれば、危険もありません。　しかもこのコードは、一般論的に言って高速です。

しかし、この配列定義は 10MB のメモリを消費します。　パケットの多くが数百バイトだとしたら、これは壮大な無駄です。　また、「同時に最大 1000カ所」とか、「最大１万バイト」という条件が、将来的に変わったら、無駄は、さらに増えるでしょう。

メモリを無駄に使っても、簡単・高速に動かしたい、という場合は、これでも良いのですが、無駄をなるべく省きたい場合は、ポインタの出番です。

まずは、次のように宣言します。

[code]char * packet_content[ 1000 ];
[/code]これは、char型領域を指すポインタを 1000個並べただけで、パケット内容を格納する領域はどこにもありません。　とりあえず「メモ用紙の束」だけ作っておいた、という感じです。　この配列定義が消費するメモリは、たかだか数KB です。

パケットを 1つ受信したら、そのヘッダ内の内容長を見て、次のようにします。

[code]packet_content[ パケット番号 ] = malloc( 内容長 );
[/code]malloc( ) は、「指定されたバイト長の連続したメモリの小箱を確保して（OS から借りる）、その先頭アドレスを返してくれる」関数です。　stdlib.h の中にあります。　こういう動作を、「動的メモリ確保（dynamic memory allocation）」などと言います。

こうすれば、パケット毎に、異なる長さのメモリを、弾力的に確保出来るので、無駄を非常に少なく出来ます。

確保された領域の（０から数えて）３バイト目にアクセスするには、次のように書きます。

[code]*( packet_content[ パケット番号 ] + 3 ) = 'A'; /* 'A' を書き込んでみる */
[/code]下記のように書いても同じです。

[code]packet_content[ パケット番号 ][ 3 ] = 'A';
[/code]まともに [ 10000 ] と確保するのに比べて、malloc( ) するのは実行時間もかかりますし、プログラムも若干複雑になりますので、「実行時間コストとメモリ消費コストはバーター（引き換え）である」と言えます。

メモリコストを重視する場合は、実行時間コストが多少かかっても、動的（dynamic）な処理を選ぶ事になりますが、その場合、ポインタは欠かせません。

８．他の言語では……

ポインタの存在が見えない他言語においても、「実体を動かさず『参照』する」のは、実行時間やメモリを大きく節約できる、魅力的な機能のはずです。

実際、C より新しい言語は、ほとんどが「ポインタを実装」しています。　ただ、文法的に、それを表に出さないようにしているだけです。

たとえば Java では、必要なオブジェクトを new で作り出しますが、作り出されたオブジェクトは、内部的には「ポインタで持ち回る」形で扱われています。

[code]JPanel myPanel; // myPanel の正体は C で言うところのポインタ。C っぽく書くと、struct JPanel * myPanel;
myPanel = new JPanel( ); // new は「新しく割り当てた領域の先頭アドレス」を返す。C の malloc( ) にプラスアルファしたものと考えてよい。
myPanel.setLayout( ～ ); // C っぽく書くと、(*myPanel).setLayout( ～ );
[/code]他の言語でも、クラスや構造体、配列など、「ある程度大きなモノ」に付けられた「名前」は、内部的にはポインタである、という事は、よくあります。

こういう言語では、「わざわざ * を付けて、参照である事を明示」しなくても、名前を書くだけで「参照になる」のですが、その代わり、ポインタそのものを「ポインタとして扱う」ことは出来ないわけです。　C は、その辺りを省略せず、細かく書く言語なのです。

９．おわりに

C は、それなりに古く、今から見ると非力なコンピュータのために作られた言語です。　C が生まれた頃、複雑かつ実用的な速度で動くプログラム（たとえば OS）は、アセンブリ言語で作られていました。

そうしたプログラムを、なんとか高級言語で書きたい、生産性の良い、読みやすいプログラムを作りたい、という欲求が有ったのは当然でした。　しかし当時のコンピュータの性能で、「アセンブリ言語に比肩し得るプログラムを書ける高級言語」を考えれば、ポインタを実装せざるを得なかったのでしょう。

ポインタはアセンブリ言語っぽい概念なので、C は「高級アセンブラ」と揶揄される事もありますが、他の言語にはない、独特のテイストやバランスを生み出してもいます。　そのテイスト、バランスは、結果論として得られたものかも知れませんが、そのテイストとバランスゆえに、C は多くのプログラマに愛用され、今も生き延びている言語になったのだと私は思います。

北川権現 (Gongen Kitagawa) · Answer

Cは高級言語にしては珍しく、ハードウェアを直接触れるからです。例えばソフトウェアでハードウェアを操作するときには、特定のアドレスに命令を表す特定のデータを書き込むと言う操作をします。これがソフトとハードの境目なのですが、多くの高級言語では「開発者にハードウェアを意識させないのが良い」という思想なので、ハードウェアのアドレスを指定できないようになっています。

ところがCの場合はポインタ変数を使って任意のアドレスに直接書き込めるのです。この機能を使わなければハードウェアが操作できないので、他の言語では実装できないのです。

一応これはC++でもできます。しかしC++が使える組み込みエンジニアは多くありません。

それは組み込み系のエンジニアはもともとはハード屋さん出身の人も多く、ソフトウェアの知識は限定的なことが多いからです。

特にオブジェクト指向やらデザインパターンやらのソフトウェア工学の話は何回聞いてもさっぱりという組み込みエンジニアは多く、そのような技法を現場に持ち込むと黒船扱いされます。

私はそのようなハード屋に近いプログラマーと仕事をしたことがありますが、継承とかポリモーフィズムのような実際のハードウェアの動きをソフト的に抽象化されるとさっぱり理解できないようでした。

Shiro Kawai · Answer

ベテランの方はCは簡単とおっしゃいますが、最近また難しくなってきたんですよ。オプティマイザが言語仕様ギリギリを攻めるようになってきたんで、「ポインタなんてメモリのアドレスでしょ」という認識だとハマります。

初心者が基礎的な範囲内で使ってる分には滅多に落とし穴は踏まないと思うんですが、中級者になってそこを踏んでしまうと、なぜ動かないかのを理解するのに分厚い言語仕様を調べるハメになるんで、スパルタンに鍛えられるという意味では難しいと言えるかと。

ごく最近もこういう事例に当たりました。20年以上広く使われてきたOSSのライブラリが、新しいコンパイラで以前と異なる結果を返すようになって調査したんです。原因はここでした。

[code]        void *buf56 = &context-%3Es256.buffer[56];
        *(sha_word64*)buf56 = context-%3Es256.bitcount;

/* Final transform: */
        SHA256_Internal_Transform(context, (sha_word32*)context-%3Es256.buffer);
[/code]context-%3Es256.bitcountは64ビットワードで、最初の2行はそれをバッファの56オクテット目からネイティブバイトオーダーで格納する、というのを意図してます。その後バッファを別の関数に渡しています。

最近のコンパイラ使ってる方はもうピンと来たと思いますが。gcc9だと、「bitcountをバッファに格納する」というインストラクションが出力されません。無かったことになります。

なお、SHA256_Internal_Transformの呼び出しの直前に別の関数呼び出しを入れると、「bitcountをバッファに格納する」というインストラクションが出力されるようになります。

この挙動を説明するには、strict aliasing ruleとオプティマイザの気持ちを説明しなければならず、中級者になったばかりくらいの人にそれを説明するのはちと大変だなあと思うわけです。

A1a · Answer

私見です。

私がいつも（特に私が若い頃に当時高齢者層のおっさんに）説明してたのは、

C（C++も）はミッション車です。ATのようには運転できません、です。

もう少し説明する場合は、

最近の高級言語って、AT車みたくハンドル・アクセル・ブレーキの操作が分かれば動かせます。
なんなら衝突防止とかSBSとか、多少手荒な事をしても自動でやってくれる装置がいっぱい使える車もあります。

が、
Cは低級言語と云われてて、シフト・クラッチと同じく、車が進む仕掛けに近い部分を理解して、扱えないと（作れないし）動きません。なんならそっちの方が大事で、面倒で、解ってないと車壊すか事故起こすのも同じ。

その代わり、AT車では出来ないような事が出来ます。ダブルクラッチとかLOWに入れてエンブレ利かすとか。
でも、うまく加減してやれないと、かぶってエンストやら、使いすぎたクラッチが滑ってすっぽ抜けてとか、そういう事が起こります。そういう加減がシロウトには難しい言語です。
ただ、勝手にギア比が変わって、、みたいな想定外もない。（想定外が起こったけど解決出来ない、のはシステム的にはやっかいです）

と云ってました。

ただ、これってAT免許なんてなかった時代に免許取った（つまり今8t限定中型免許）の世代にはけっこう有効で、ついでにダブルクラッチやら昔ばなしに花が咲いておっさん客と仲良くなれるし、しかもそれを得意になって社内で話してくれたりして、こっちペースで廻せるきっかけになるいい手だったんですが、

若い子には解らないみたいです。

今なら、何に例えればいいんでしょうね、、

Miyata Akira · Answer

セミコロンは文と文を区切る区切子（デリミタ）ではなく、ましてや、単なる飾りでもありません。C言語において構文上の重要な役割を持っています。

セミコロンは文の一種である式文（expression statement）を構成する終端記号です。もしセミコロンがなければ文とはならず、式（expression）として扱われます。

C言語が登場した1970年代当時、他の言語と一線を画した機能の一つに代入式があります。代入式はALGOLが発祥ですが、商用で成功したプログラミング言語ではC言語をもって嚆矢とします。当時主流だった多くのプログラミング言語には代入文はあっても代入式はありませんでした。この二つは似て非なるもので、文法上の位置づけが異なります。

例えばC言語で y = x * 0.5 と書けば、これはセミコロンで終わっていないので代入文ではなく、代入式と呼ばれる式の一種でしかありません。代入式は「左辺式 ＝ 右辺式」という形をしており、

* 左辺式が指し示すオブジェクトに、右辺式の値を代入するとともに
 * そのオブジェクトの代入後の値を代入式自身の値とする
という働きをします。y = x * 0.5 の例では、仮に変数 x の値が 3.0 だとすれば、右辺の乗算式 x * 0.5 の計算結果すなわち 1.5 が変数 y に代入され、さらに、代入後の変数 y の値すなわち 1.5 が代入式 y = x * 0.5 の値となります。

これの何がスゴイかというと、代入式は式の一種なので別の式の中に代入式を含ませることができるのです。例えば z = y = x = 1.0 という式が書けるのです。これは、括弧を使って演算子の優先順位を分かりやすく示せば、 z = (y = (x = 1.0)) と書いたのと同じです。x = ~、y = ~、z = ~ という3つの代入式が入れ子になっており、いずれの代入式の値も 1.0 で、結果として、x, y, z のそれぞれに 1.0 を代入したのと等価になります。

さらには、sqrt(a = (b = 6.0) + 10.0) なんて式も書けます。これは、変数 b に 6.0 を代入し、6.0 + 10.0 を計算して変数 a に 16.0 を代入し、さらに sqrt(16.0) を計算して 4.0 を返す式です。FORTRANやBASICではこんな芸当はとてもできません。最近流行りの Python ですら代入式が導入されたのは最近（バージョン3.8）からであり、しかも代入式が使える箇所は限定的です。

このように、C言語ではそれまでの式の概念を大幅に拡張しました。そして、任意の式の末尾にセミコロンを付けた構文「式 ; 」を式文と定義し、文の一種としました。プログラム上の意味があるかどうかは別として、以下の各行はいずれも式文です。

[code]a = 3.0;
1.0 + 4.0;
b;
b + c;
sqrt(x);
[/code]

金野 祥久 (Akihisa Konno) · Answer

30年以上前の自分を思い出しました．懐かしいなー．同じようなことを考えて，当時住んでいたアパートにほど近い，南阿佐ヶ谷駅の横にあった本屋に行き，Cのソースコードがいちばんたくさん掲載されている本を買うことにしました．そこで出会ったのがMINIXオペレーティング・システムです．

https://www.amazon.co.jp/MINIX%E3%82%AA%E3%83%9A%E3%83%AC%E3%83%BC%E3%83%86%E3%82%A3%E3%83%B3%E3%82%B0%E3%83%BB%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0-%E3%82%A2%E3%82%B9%E3%82%AD%E3%83%BC%E3%83%96%E3%83%83%E3%82%AF%E3%82%B9-%E3%82%A2%E3%83%B3%E3%83%89%E3%83%AA%E3%83%A5%E3%83%BC%E3%83%BBS-%E3%82%BF%E3%83%8D%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0/dp/4756100007
この本でUNIX文化の一端に触れたことは，その後の自分に大きな影響を与えました．UNIXやLinuxをある程度知っているふりができるのもこの本と，この本をきっかけとしてその後手にすることになる関連本のおかげです．あの本屋はもうなくなってしまったようですが，当時あの狭くてごちゃごちゃした本屋でこの本にばったり出会ったことは，思い返してみると幸運なことでした．

というわけで，「このあとどうすればいいですか?」に対する私なりの答えは「本屋さんに行ってみよう」です．

ただ残念なことに，いま本屋に行ってC言語やそれに関連した本を探しても，ソースコードが何10ページにも渡って掲載されているような本は見つからないでしょう．…えっ，ああ，そうです．上のMINIX本にはMINIXのソースコードがすべて掲載されていたので，ほんとうに何10ページもCのプログラムが載っていたわけです．私がこの本を買ったのは1989年のことですが，当時のパソコン関連本はいまほど人口に膾炙していませんでしたから，尖った本が多かったのです．いまはそういう本が少なくて物足りない気がします．

ですので，専門書をたくさん置いてある大型書店に行くのがよいかと思います．あるいはちょっと古めの洋書を探すとか．尖っている本に出会ってほしいと思います．

参考になれば幸いです．