K.Maebashi's BBS 一覧表示

[1760] Re:DIKSAM_book_0_4のLinuxでの実行結果について (その２)

投稿者：(ぱ)こと管理人

2011/12/22 03:47:16

>入力ソースは1行だけで、　println("あいうえおbb"); ええとですね。 >まだ、マルチバイト無しのエラー系は完璧には動作していません。「マルチバイト無しのエラー系」が動かないのではなくて、「マルチバイトありの正常系」が動かない、というのが現状ということでしょうか? そうだとして、 >パラメタのst_string_literal_bufferは、”\240「,ヲィbb”で化けております。 >入力ソースは1行だけで、　println("あいうえおbb"); st_string_literal_bufferをデバッガで見たのだと思いますが、それだと、バイト列をデバッガが表示するところで文字化けが起きるので、渡ってきている正確なバイト列はわからないと思います。ただ、いずれにしてもbbまで出ているわけですから、入力ファイルの、ダブルクォートが始まってから終わるまでの文字列は、dvm_mbstowcs_len()にまで届いているように見えます。(たぶんですが。バイト数が違うっぽいのが結構怪しいですが) >①～③までの役割は以下の解釈であっているでしょうか？ >　①は、マルチバイト処理用、 >　　SJISコードの漢字の範囲のコードが来たら２バイト単位で >　　リテラルに取り上げる所 >　②は、1バイト処理用 >　　リテラル文字を１バイト単位でリテラルに取り上げる箇所 >　③は、②の続きで、 >　　コンパイル時の指定文字コードがSJISだった場合、 >　　２バイト目に0x5cを持つ可能性がある1バイト目が来た場合、 >　　次の2バイト目も一緒にリテラルに吸上げる所これは合っていますけど、いずれにしてもこの処理は、「入力ファイルの、ダブルクォートが始まってから終わるまでのバイト列」を、間違いなくdvm_mbstowcs_len()に届けるための処理でしかありません。0x5cのような変な文字が来なければ、あまり意識しなくてよいはずのところです。そこで確認ですが、 ①入力ファイルの文字コードは何でしょうか? od -cxかなにかでバイト列は取得できますか? ②dvm_mbstowcs_lenに渡す直前の、st_string_literal_bufferのバイト列は取得できますか? st_string_literal_buffer[0]～[12]までの値はわかりますか? そこまでわかったら、正確なバイト列がdvm_mbstowcs_len(の中のmbrtowc)に渡ったと仮定できますから、環境変数LANGが何であるのかとかの話になるのかと思います。

[この投稿を含むスレッドを表示] [この投稿を削除]

[1759] Re:DIKSAM_book_0_4のLinuxでの実行結果について (その２)

返信

投稿者：ICHIA

2011/12/22 03:10:54

Link:

追加情報になります。 diksam.l の動作について SJIS対応の文字リテラルで関係のありそうな箇所（①～③）に、 printf()を入れてデバックしてみました。 ①～③までの役割は以下の解釈であっているでしょうか？　①は、マルチバイト処理用、　　SJISコードの漢字の範囲のコードが来たら２バイト単位で　　リテラルに取り上げる所　②は、1バイト処理用　　リテラル文字を１バイト単位でリテラルに取り上げる箇所　③は、②の続きで、　　コンパイル時の指定文字コードがSJISだった場合、　　２バイト目に0x5cを持つ可能性がある1バイト目が来た場合、　　次の2バイト目も一緒にリテラルに吸上げる所 ######### <STRING_LITERAL_STATE>[\x81-\x9f\xe0-\xef][\x40-\x7e\x80-\xfc] { ① dkc_add_string_literal(yytext[0]); dkc_add_string_literal(yytext[1]); } <STRING_LITERAL_STATE><<EOF>> { dkc_compile_error(dkc_get_current_compiler()->current_line_number, EOF_IN_STRING_LITERAL_ERR, MESSAGE_ARGUMENT_END); } <STRING_LITERAL_STATE>. { Encoding enc = dkc_get_current_compiler()->source_encoding; ② dkc_add_string_literal(yytext[0]); if (enc == SHIFT_JIS_ENCODING && ((unsigned char*)yytext)[0] >= 0x81 && ((unsigned char*)yytext)[0] <= 0x9e) { ③ BEGIN SHIFT_JIS_2ND_CHAR; } } ######### ”表”等の文字を入れても①③が表示されておらず、②ばかりでした。自分の解釈からすると、日本語は①か③で処理されるはずだと思っていましたが、どうも違っていました。 enc=SJISだと判定されていないのか？ SJIS文字コードは取得できていないのか？どうしてそうなってしまうのか？そこで、encの確認をしてみました。 ③のIFの条件を、SJISだった場合と2バイト目が0x5c範囲を持つものと段階的にバラシて見ました。 #### if(enc == SHIFT_JIS_ENCODING){ ④ if(((unsigned char*)yytext)[0] >= 0x81) && ((unsigned char*)yytext)[0] <= 0x9e) ){ ③ ##### ④は表示されました。コンパイルのencは問題ないようです。＠そこで、solaris特有なのか？と思い、このサーバにEUCコードの環境を作って動作させて見ました。ちょっと手を加える必要がありましたが、動作しました。 test/test.dkm を動作させた所、「不正なマルチバイト」が出力されました。お尻の「日本語」の部分をコメントにしたら、正常に動作しました。更に、「日本語」を分解していき、「語」があると「不正なマルチバイト」になる事がわかりました。また、exit(1)を削除して、最後の文字列を表示させてみたら同じく「不正なマルチバイト」になり、上記と同様にしたら「れ」が原因だと判明しました。語： B8EC れ： A4EC と2バイト目が"EC"で何かあるのでしょうか？0x5cの様なものが。 asciiコードの"EC"を見てもおかしくなるような感じはありませんでしたが・・・以上が現在の調査状況になります。なにか、ヒントがあればよろしくお願い致します。相手をしてくれて感謝しております。

[この投稿を含むスレッドを表示] [この投稿を削除]

[1758] Re:DIKSAM_book_0_4のLinuxでの実行結果について (その２)

返信

投稿者：ICHIA

2011/12/21 00:09:24

Link:

回答ありがとうございました。凄く参考になりました。 GDBで確認しました、内容は以下の通りになります。 >その中のどれでエラーになっているかはわかりますでしょうか? string.c dkc_close_string_literal(void) { ････････ dkc_add_string_literal('\0'); new_str_len = dvm_mbstowcs_len(st_string_literal_buffer); if (new_str_len < 0) { ERRORメッセージ出力不正なマルチバイトのエラーは、 dvm_mbstowcs_len() の復帰値が、”－１”で発生していました。パラメタのst_string_literal_bufferは、”\240「,ヲィbb”で化けております。入力ソースは1行だけで、　println("あいうえおbb"); マルチバイトなしでの確認をしました。入力ソースは1行だけで、　println("aaaaaaaaa"); 正常に動作しました。パラメタのst_string_literal_bufferは、「aaaaaaaaaa」でした。なので、マルチバイトの時の読み込みがやはりうまくいっていないのだと判断してもよいと思われます。字句解析のどこで詰まっているんでしょうか？ GDBで解析してみましたが、イマイチ解析箇所がわかりませんでした。また、なにかヒントがあれば教えてください。ピンポイントで指摘して頂けるので、本当に助かります。以上です、よろしくお願い致します。

[この投稿を含むスレッドを表示] [この投稿を削除]

[1757] Re:DIKSAM_book_0_4のLinuxでの実行結果について (その２)

返信

投稿者：(ぱ)こと管理人

2011/12/20 02:41:53

Link: http://kmaebashi.com

引用の順番を変えています。 >以下の箇所は、EUC版もWINDOWS版(SJIS)も違いがありませんが、 >コード系関係なく同じで構わないのでしょうか？この部分は、 dkc_get_current_compiler()->source_encoding; の値により動きを変えており、それの値はMakefile中の -DSHIFT_JIS_CODEのような指定で制御しています(interface.c)。しかし、仮にここの指定を誤っていたとしても、入力するソースがASCII文字からだけで構成されているのなら、エラーにはならないように思います。 >やっとDIKSAMが、マルチバイト無しの正常系が動作し始めました。 >まだ、マルチバイト無しのエラー系は完璧には動作していません。「マルチバイト無しのエラー系」とのことですし。 >自分のSJIS環境では、「不正なマルチバイト文字です。」と >なってしまいます。このエラーメッセージは、このように、列挙子BAD_MULTIBYTE_CHARACTER_ERRに対応しています。 dkc_compile_error(dkc_get_current_compiler()->current_line_number, BAD_MULTIBYTE_CHARACTER_ERR, MESSAGE_ARGUMENT_END); これが発生する箇所は、BAD_MULTIBYTE_CHARACTER_ERRで*.cを検索するとわかるようにDiksamのver.4系だと5箇所あるようです。 ver.2系だと4箇所のようです。こちら： http://kmaebashi.com/programmer/devlang/diksam_src_0_2/R/19.html その中のどれでエラーになっているかはわかりますでしょうか? 何を言っているのかというと、入力となるDiksamのソースのマルチバイト文字の解釈でエラーになっているのではなく、別の原因で起きたコンパイルエラーの、日本語エラーメッセージの変換でエラーになっているのでは? と思っているわけです。そちらの環境が再現できてるわけでもないのであくまで推測です。また、もしエラーメッセージの変換で失敗しているのなら、「不正なマルチバイト文字です。」はなぜ正しく出るのかという疑問もわきます。というわけで確定情報は出せませんが、参考になりましたら。

[この投稿を含むスレッドを表示] [この投稿を削除]

[1756] Re:DIKSAM_book_0_4のLinuxでの実行結果について (その２)

返信

投稿者：（ぱ）こと管理人

2011/12/19 12:56:43

Link:

すみません、回答遅れております。その場所はencがSJISであるかどうかで動きが変わるのですが、それを決めているのはMakefileの-DSHIFT_JIS_SOURCEとかです。今は携帯で辛いので詳細は今夜に。 >先日は、Solaris＋SJISコードで動作させる為の環境構築の方法を教えて頂いてありがとうございました。 >やっとDIKSAMが、マルチバイト無しの正常系が動作し始めました。 >まだ、マルチバイト無しのエラー系は完璧には動作していません。 >##################### >int a=0; > >if(a==0){ > println("CCCC"); >##################### >このソースと全く同じではありませんが、「｝なし」のエラーを狙いテストしますが、 >EUC版は、「文法エラー($(token)付近)」　が出力されます。 >自分のSJIS環境では、「不正なマルチバイト文字です。」と >なってしまいます。 > >そこで、つっかえている所がマルチバイトの読込み辺りだと当たりがつきます。 > >また、自分の構築している環境では、マルチバイトが処理出来ていません。 >字句解析(lex)でのマルチバイトの読込みがまだうまく出来ていないからだと思っています。 > >ちゃんと調べてもいないのに質問して申し訳ありませんが、教えてください。 >以下の箇所は、EUC版もWINDOWS版(SJIS)も違いがありませんが、コード系関係なく同じで構わないのでしょうか？ >自分の構築したい環境でなにか考慮すべき所はありませんでしょうか？ > ><STRING_LITERAL_STATE>[\x81-\x9f\xe0-\xef][\x40-\x7e\x80-\xfc] { > dkc_add_string_literal(yytext[0]); > dkc_add_string_literal(yytext[1]); >} ><STRING_LITERAL_STATE>. { > Encoding enc = dkc_get_current_compiler()->source_encoding; > dkc_add_string_literal(yytext[0]); > if (enc == SHIFT_JIS_ENCODING > && ((unsigned char*)yytext)[0] >= 0x81 > && ((unsigned char*)yytext)[0] <= 0x9e) { > BEGIN SHIFT_JIS_2ND_CHAR; > } >} ><SHIFT_JIS_2ND_CHAR>. { > dkc_add_string_literal(yytext[0]); > BEGIN STRING_LITERAL_STATE; >} >

[この投稿を含むスレッドを表示] [この投稿を削除]

[1755] Re:DIKSAM_book_0_4のLinuxでの実行結果について (その２)

返信

投稿者：ICHIA

2011/12/16 04:24:32

Link:

先日は、Solaris＋SJISコードで動作させる為の環境構築の方法を教えて頂いてありがとうございました。やっとDIKSAMが、マルチバイト無しの正常系が動作し始めました。まだ、マルチバイト無しのエラー系は完璧には動作していません。 ##################### int a=0; if(a==0){ println("CCCC"); ##################### このソースと全く同じではありませんが、「｝なし」のエラーを狙いテストしますが、 EUC版は、「文法エラー($(token)付近)」　が出力されます。自分のSJIS環境では、「不正なマルチバイト文字です。」となってしまいます。そこで、つっかえている所がマルチバイトの読込み辺りだと当たりがつきます。また、自分の構築している環境では、マルチバイトが処理出来ていません。字句解析(lex)でのマルチバイトの読込みがまだうまく出来ていないからだと思っています。ちゃんと調べてもいないのに質問して申し訳ありませんが、教えてください。以下の箇所は、EUC版もWINDOWS版(SJIS)も違いがありませんが、コード系関係なく同じで構わないのでしょうか？自分の構築したい環境でなにか考慮すべき所はありませんでしょうか？ <STRING_LITERAL_STATE>[\x81-\x9f\xe0-\xef][\x40-\x7e\x80-\xfc] { dkc_add_string_literal(yytext[0]); dkc_add_string_literal(yytext[1]); } <STRING_LITERAL_STATE>. { Encoding enc = dkc_get_current_compiler()->source_encoding; dkc_add_string_literal(yytext[0]); if (enc == SHIFT_JIS_ENCODING && ((unsigned char*)yytext)[0] >= 0x81 && ((unsigned char*)yytext)[0] <= 0x9e) { BEGIN SHIFT_JIS_2ND_CHAR; } } <SHIFT_JIS_2ND_CHAR>. { dkc_add_string_literal(yytext[0]); BEGIN STRING_LITERAL_STATE; }

[この投稿を含むスレッドを表示] [この投稿を削除]

[1751] Re:DIKSAM_book_0_4のLinuxでの実行結果について (その２)

返信

投稿者：(ぱ)こと管理人

2011/11/27 23:10:36

Link: http://kmaebashi.com

はじめまして。 >なので、漢字コードがSJISになっております。 > >LANG環境変数＝ja_JP.PCK > >そこで、もちろんなんですが、EUC版もUTF-8版も下記エラーになってしまいます。 >どの様に対応したらよいのか教えて頂けないでしょうか？ crowbarやDiksamのソースコードで、SJIS版、EUC版、UTF-8版の違いは以下の通りです。 (1)error_message.cの文字コードが違う。crowbar, Diksamともに、　エラーメッセージは日本語で出ますし、そのメッセージはerror_message.c内に　埋め込まれています。エラーメッセージも表示前にwchar_tに変換するのですが、　この変換でエラーになっているというのが現状です。 (2)(コンパイラの)Makefileの中に-DEUC_SOURCEとか-DSHIFT_JIS_SOURCEとかの　指定が入っている。SJISでは、「表」のように2バイト目に0x5Cを含む　文字が存在しうるので、いわゆる0x5C問題が起こります。これを回避する　コードが入っています。(-DEUC_SOURCEと-DUTF8_SOURCEの動きは同じです) 　これを使用しているのはcrowbar.lまたはdiksam.lです。 (3)お使いのコンパイラがgccの場合は、gcc自体の0x5C問題に引っかかるので、　SJIS版(Windows版)のerror_message.cでは、随所に\が入っています。　Windows版のerror_message.cを使うか、gccのオプション指定をする必要が　あります。というわけで、対策は以下のようになるかと思います。(試していません) ・error_message.cの文字コードをSJISにする。必要に応じて\を入れて　0x5C問題に対応するか、gccのオプションを指定する。・Makefileの-DEUC_SOURCEとかになっているところを「-DSHIFT_JIS_SOURCE」に　変更する。 Windows版のソースを参考にされるとよいのではないかと。

[この投稿を含むスレッドを表示] [この投稿を削除]

[1747] Re:Cにおける列挙型の扱いについて

返信

投稿者：774RR

2011/10/10 12:54:21

Link:

以下 JIS X3010:2003 より抜粋するので C の場合に限定 6.7.2.2 - 列挙型 - 列挙子並びの中の識別子は、型 int を持つ定数として宣言され、この型の定数が許されるところならばどこに現れてもよいなので元ネタのキャストは要らないと判断してよさそうです。 enum e_aaa 型の underlying type は char であってもよい、のと、その要素である aaa の型は int である、のとが矛盾してるように見えますが・・・ # 集合論的におかしい enum 型の識別子ではなくて enum 型の変数（オブジェクト）が現れた場合には 6.2.5 - 型 - 列挙体は[整数型]である 6.3.1.1 - 整数型 - 整数拡張元の型のすべての値が int 型で表現可能な場合 int 型に変換される 6.7.2.2 - 列挙型 - 列挙定数の (既述につき snip) となり、やはり int となるため問題ないです。 6.7.2.2 の[制約]は[定数の値を定義する式]としか書いてないので、 enum e_bbb { bbb=2147483647, ccc }; は言語規格書的には合法と考えざるを得ません。 # gcc ではきっちりコンパイルエラーになりますが。 C++ の場合はこの辺いろいろ規制緩和されている＋言語仕様も厳密化されているので仕様書を読んでいて安心できます。先の [制約] のような不安要素も文書化され済み。

[この投稿を含むスレッドを表示] [この投稿を削除]

[1744] Cにおける列挙型の扱いについて

返信

投稿者：yuya

2011/10/07 09:35:26

Link:

C限定の話で、列挙型についての疑問です。 JIS X3010:2003の6.7.2.2 列挙型指定子(p77～p78)に、 > 制約　列挙定数の値を定義する式は、int型で表現可能な値を持つ整数定数式でなければならない（中略） >それぞれの列挙型は、char、符号付き整数型又は符号無し整数型と適合する型とする。型の選択は、処理系定義とする。しかし、その型は列挙型のすべてのメンバの値を表現できなければならない。とあります。列挙型が必ずしもint型ではなく上記のような選択の余地を処理系に与えているのは、例えばメンバの値の範囲がcharで収まるなら、処理系はcharを使って領域を節約してもよい、という意義だと理解してよいのでしょうか？通常、列挙体のメンバを式中で用いるときには、何も意識せずにint型の定数として（私は）書いているのですが、このメンバ自体はint型とは限らないわけですよね。ある列挙型に対して例えば「charと適合する型」が選ばれた場合、そのメンバはあくまで「（charと適合する）列挙型の列挙定数」であって、式の中に現れると汎整数拡張されてint型に格上げされる、という理解でよいのでしょうか？この疑問が生じた直接のきっかけは、（ぱ）さんの「プログラミング言語MIL」の雑誌記事のmini_mvm.cにおいて、 (A)や(B)の箇所でintへのキャストがなされているのを見て、「どんなときにキャストすべきなんだっけ？」と再考したことによります。相変わらず記事の本筋と関係なくてすみません……。皆様よろしければご教示ください。 typedef enum { OP_PUSH_INT, OP_ADD, OP_MUL, OP_PRINT } OpCode; int g_bytecode[] = { /* (A) */ (int)OP_PUSH_INT, 10, (int)OP_PUSH_INT, 2, (int)OP_PUSH_INT, 4, (int)OP_MUL, (int)OP_ADD, (int)OP_PRINT, }; int st_stack[STACK_SIZE_MAX]; void mvm_execute(void){ int pc = 0; int sp = 0; // スタックポインタ while (pc < sizeof(g_bytecode) / sizeof(*g_bytecode)) { switch (g_bytecode[pc]) { case OP_PUSH_INT: // 整数をスタックに積む st_stack[sp] = (int)g_bytecode[pc+1]; /* (B) */ sp++; pc += 2; break; case OP_ADD: // 加算 /* 以下略 */ } } }

[この投稿を含むスレッドを表示] [この投稿を削除]

[1741] Re:ローカル変数のアドレスをスタックにpushしている？

返信

投稿者：とも

2011/09/11 11:34:04

Link:

早速のお返事ありがとうございます。なるほど、crowbarスタックの構造を勘違いしてました。 Stack構造体のstackメンバがCRB_Value*型だということは、"CRB_Value*"の集合ではなく、"CRB_Value"そのものの集合だということですね。自分で作成中のものが、スタックを"アドレスの集合"にしているので、それと同じだと思い込んでいました。参考になりました。これからも、「プログラミング言語を作る」を参考にオリジナル言語の作成を続けたいと思います。 >こんにちは。ご意見ありがとうございます。 > >>「プログラミング言語を作る」を大いに参考にさせて頂いています。 >>というより、かなりまねをさせてもらってます。 > >そういっていただけると私も嬉しいです。 > >>関数の初頭で、resultというCRB_Value型の変数を宣言していますね。 >>式の評価結果をそれに詰め、最終的にcrowbarスタックにそのアドレスをpushしていると思います。 >>しかし、resultはローカル変数なので、関数を抜けるとその領域は既に使えないのではないか？という心配です。 > >・resultはローカル変数なので、関数を抜けるとその領域は使えません。 >・最終的にcrowbarスタックにresultをpush()する際は、以下のような処理を >　行っています。 > push_value(inter, &result); >・resultのポインタをpush_value()に渡したって、resultの領域は >　すぐに開放されてしまうのだから役に立たないのではないか? というのが >　ご懸念されていることだと思います。 > >しかし、push_value()の中では、最終的には以下のようにして値をcrowbarスタックに >格納しています。 > >static void >push_value(CRB_Interpreter *inter, CRB_Value *value) >{ >(中略) > inter->stack.stack[inter->stack.stack_pointer] = *value; > >渡されたCRB_Valueは確かにポインタですが、*演算子により >「ポインタの指す先の値」をコピーしてスタックに格納していますので、 >この後でresultが開放されても問題ありません。 > >なお、push_value()の引数として、CRB_Value*ではなくCRB_Valueを受け取るように >することはもちろん可能です。 >現状の実装でなぜポインタを渡しているのかというと…… 構造体は大きいかも >しれないので値渡しをすると効率上の問題が出るかも、という懸念があったのかと >思います。実際問題としては、CRB_Value程度のサイズの型なら値渡しにするという >選択肢は十分考えられると思うのですけれども。

[この投稿を含むスレッドを表示] [この投稿を削除]

[1740] Re:ローカル変数のアドレスをスタックにpushしている？

返信

投稿者：(ぱ)こと管理人

2011/09/11 03:00:48

Link: http://kmaebashi.com

こんにちは。ご意見ありがとうございます。 >「プログラミング言語を作る」を大いに参考にさせて頂いています。 >というより、かなりまねをさせてもらってます。そういっていただけると私も嬉しいです。 >関数の初頭で、resultというCRB_Value型の変数を宣言していますね。 >式の評価結果をそれに詰め、最終的にcrowbarスタックにそのアドレスをpushしていると思います。 >しかし、resultはローカル変数なので、関数を抜けるとその領域は既に使えないのではないか？という心配です。・resultはローカル変数なので、関数を抜けるとその領域は使えません。・最終的にcrowbarスタックにresultをpush()する際は、以下のような処理を　行っています。 push_value(inter, &result); ・resultのポインタをpush_value()に渡したって、resultの領域は　すぐに開放されてしまうのだから役に立たないのではないか? というのが　ご懸念されていることだと思います。しかし、push_value()の中では、最終的には以下のようにして値をcrowbarスタックに格納しています。 static void push_value(CRB_Interpreter *inter, CRB_Value *value) { (中略) inter->stack.stack[inter->stack.stack_pointer] = *value; 渡されたCRB_Valueは確かにポインタですが、*演算子により「ポインタの指す先の値」をコピーしてスタックに格納していますので、この後でresultが開放されても問題ありません。なお、push_value()の引数として、CRB_Value*ではなくCRB_Valueを受け取るようにすることはもちろん可能です。現状の実装でなぜポインタを渡しているのかというと…… 構造体は大きいかもしれないので値渡しをすると効率上の問題が出るかも、という懸念があったのかと思います。実際問題としては、CRB_Value程度のサイズの型なら値渡しにするという選択肢は十分考えられると思うのですけれども。

[この投稿を含むスレッドを表示] [この投稿を削除]

[1739] ローカル変数のアドレスをスタックにpushしている？

返信

投稿者：とも

2011/09/10 21:18:23

Link:

始めて投稿します。趣味で、オリジナルの言語を作成している途中です。「プログラミング言語を作る」を大いに参考にさせて頂いています。というより、かなりまねをさせてもらってます。その中で気になるところがあり、投稿しました。私自身はＣ言語をそれなりに習得しているつもりなのですが、誤解があったらご指摘下さい。気になったのは、書籍の163ページの下部から165ページにわたる、eval_method_call_expression関数の例です。 eval系では、似たようなコードがいくつかあると思います。関数の初頭で、resultというCRB_Value型の変数を宣言していますね。式の評価結果をそれに詰め、最終的にcrowbarスタックにそのアドレスをpushしていると思います。しかし、resultはローカル変数なので、関数を抜けるとその領域は既に使えないのではないか？という心配です。Ｃでは関数の戻り値としてローカル変数のアドレスを返そうとすると警告が出ると思います。書籍の例は、関数の戻り値として返しているわけではないので警告は出ないとは思います。が、crowbarスタックにpushするということは、後からそれを使用する可能性があると思うのですが。つまり次のプログラムと本質的には同じ事をしているように思えます。 ---------------------------------------------- #include <stdio.h> typedef struct { int type; char* data; } CRB_Value; CRB_Value *value; void eval_method_call_expression(){ CRB_Value result; result.type = 10; result.data = "Hello!"; value = &result; } int main(){ eval_method_call_expression(); printf("%d\n", value->type); printf("%s\n", value->data); } ---------------------------------------------- コンパイルではエラーも警告も出ないですが、上のプログラムはもちろん不正です。既に議論済みだったら申し訳ありません。はたまた、私がとんでもない勘違いをしているかもしれません。御教示をお願いいたします。

[この投稿を含むスレッドを表示] [この投稿を削除]

[1735] Re:もう忘れられている気が・・・

返信

投稿者：山

2011/08/14 16:28:20

Link:

返事ありがとうございます。 >これって問題になるほど遅いですかね? 関数パラメータのコピーや、ローカル変数の設定命や、その初期値の設定等がバイトコードではなく、C＋＋の１関数でまとめて領域を作成して、定数コピーと参照アドレスの一括変換をする予定なので。ローカル変数の設定処理に一切のバイトコードが無くなるんです。その結果、トータルとして関数コールがとても高速になると思いますよ。 >6.5万行というと、言語処理系としては相当なサイズだと思うのですが… いえ、ほとんどは、私が作っている言語以外のシステムのコードです。言語部分はそれほど多くはないです。たぶん、前回の出した行数より少し増えただけだと思います。いまは、画面表示は総てDirectXで表示して、３Dキャラが動き回ってます。もちろん、コンソール的な機能も持っていて、print関数もDirectX上でコンソールをエミュレートして表示しています。getchar()やgets()関数もある。これをしたからといってシステムが入力待ちで止まったりはしません。言語上の１スレッドが入力待ちでシステムにもどる（タスクスイッチのOSに処理が戻るようなもの）だけです。いまは、システム全体をセーブして、ロードするとそこから再開できる機能を作っています。ちょっと苦労してる。 PCで言うところにリジュームみたいな機能です。今のバイトコードです。関数コールとリターンを分割したので、void関数コールは速いです組み込み関数と言語上の関数も分割。一般的な言語ではなく、組込言語なので、エラー処理のほとんどはシステムが受け持って処理するので、ほとんどの関数はエラーリターンがありません。そのため、90％以上の関数はvoid型になり高速処理されます。そうそう、総ての型にキャスト命令を作っていますが、明示的な型変換の方がいいのか多少悩み中。将来この自動キャストは止めるかもしれません。　↓ {L"dummy", L"", 0}, {L"push_int_1byte", L"b",8}, {L"push_int_2byte", L"s",8}, {L"push_int_4byte", L"i",8}, // 実際の値を持つ {L"push_double_0", L"", 12}, {L"push_double_1", L"", 12}, {L"push_double_8byte", L"d",12}, // 実際の値を持つ {L"push_string_const", L"s",12}, // 文字列の位置NOを持つ０～ {L"push_null", L"", 8}, /**********/ {L"push_stack_int", L"s", 8}, // intローカル変数をスタックに {L"push_stack_double", L"s", 8}, // {L"push_stack_string", L"s", 12}, // {L"pop_stack_int", L"s", -8}, // スタックのintをローカル変数に {L"pop_stack_double", L"s", -8}, // {L"pop_stack_string", L"s", -12}, // /**********/ {L"push_static_int", L"s", 8}, // int静的変数をスタックに予約 {L"push_static_double", L"s", 12}, // {L"push_static_string", L"s", 12}, // {L"pop_static_int", L"s", -8}, // スタックのintを静的変数に予約 {L"pop_static_double", L"s", -12}, // {L"pop_static_string", L"s", -12}, // /**********/ {L"push_sheet", L"s", 8}, // sheet番号をスタックに {L"push_sheet_int ", L"s", 8}, // sheet変数をスタックに {L"push_sheet_double", L"s", 12}, // {L"push_sheet_str ", L"s", 12}, // {L"pop_sheet_int ", L"s", -24}, // スタックからsheet変数に {L"pop_sheet_double", L"s", -28}, // {L"pop_sheet_str ", L"s", -28}, // /**********/ {L"push_sheet_ref", L"s", 8}, // 参照したsheet番号をスタックに {L"push_sheet_ref_int ", L"s", 8}, // 参照sheet変数をスタックに {L"push_sheet_ref_double", L"s", 12}, // {L"push_sheet_ref_str ", L"s", 12}, // {L"pop_sheet_ref_int ", L"s", -24}, // スタックから参照sheet変数に {L"pop_sheet_ref_double", L"s", -28}, // {L"pop_sheet_ref_str ", L"s", -28}, // /**********/ {L"push_array_ref ", L"s", 8}, // 配列参照 {L"push_array_int ", L"s", -1}, // int配列処理 {L"push_array_double", L"s", -1}, // {L"push_array_string", L"s", -1}, // {L"pop_array_int ", L"s", -1}, // スタックからint配列に {L"pop_array_double", L"s", -1}, // {L"pop_array_string", L"s", -1}, // /**********/ {L"and_int", L"", -8}, // 以下は総て算術演算子 {L"or_int", L"", -8}, {L"xor_int", L"", -8}, {L"add_int", L"", -8}, {L"add_double", L"", -12}, {L"add_string", L"", -12}, {L"sub_int", L"", -8}, {L"sub_double", L"", -12}, {L"mul_int", L"", -8}, {L"mul_double", L"", -12}, {L"div_int", L"", -8}, {L"div_double", L"", -12}, {L"mod_int", L"", -8}, {L"mod_double", L"", -12}, {L"minus_int", L"", 0}, {L"minus_double", L"", 0}, {L"increment", L"", 0}, {L"decrement", L"", 0}, // ここまで算術演算子 /**********/ {L"cast_int_to_double", L"", 4}, // 以下はキャスト処理 {L"cast_double_to_int", L"", -4}, {L"cast_string_to_int", L"", -4}, {L"cast_string_to_double", L"", 0}, {L"cast_boolean_to_string", L"", 4}, {L"cast_int_to_string", L"", 4}, {L"cast_double_to_string", L"", 0}, // ここまでキャスト処理 /**********/ {L"eq_int", L"", -8}, // 以下は総て論理演算子 {L"eq_double", L"", -16}, {L"eq_string", L"", -16}, {L"gt_int", L"", -8}, {L"gt_double", L"", -16}, {L"gt_string", L"", -16}, {L"ge_int", L"", -8}, {L"ge_double", L"", -16}, {L"ge_string", L"", -16}, {L"lt_int", L"", -8}, {L"lt_double", L"", -16}, {L"lt_string", L"", -16}, {L"le_int", L"", -8}, {L"le_double", L"", -16}, {L"le_string", L"", -16}, {L"ne_int", L"", -8}, {L"ne_double", L"", -16}, {L"ne_string", L"", -16}, // ここまで論理演算子 {L"logical_and",L"", -8}, // {L"logical_or", L"", -8}, // {L"logical_not",L"", 0}, // /**********/ {L"pop", L"", -8}, // スタックを1つ減らす {L"duplicate", L"", 16}, // スタック内容をコピーしてスタックに {L"jump", L"s", 0}, // 指定ポインターにjump {L"jump_if_true", L"s", -8}, // スタックがtrueならjump {L"jump_if_false", L"s", -8}, // スタックがfalseならjump {L"nop------------",L"", 0}, // nop /**********/ {L"push_function", L"", 0}, // 関数情報をスタック、未使用 {L"call_n_function_v", L"s", 0}, // void 組込み関数コール {L"call_n_function", L"s", 0}, // 組込み関数コール {L"call_function_v", L"ssss", 0}, // void 関数コール {L"call_function", L"ssss", 0}, // 関数コール {L"return_v", L"", -1}, // void 関数戻り {L"return", L"", -1}, // 関数戻り /**********/ {L"set_array_literal_int", L"ss", 0}, // int定数配列を変数にコピー {L"set_array_literal_double",L"ss", 0}, // double定数配列を変数にコピー {L"set_array_literal_string",L"ss", 0}, // string定数配列を変数にコピー

[この投稿を含むスレッドを表示] [この投稿を削除]