文字コードを深掘りする。文字化けはなぜ起こるのか?【文字コード1】#92

Sdílet
Vložit
  • čas přidán 29. 08. 2024

Komentáře • 284

  • @yurucom
    @yurucom  Před 11 měsíci +16

    【参考文献】
    ◯プログラマのための文字コード技術入門
    amzn.to/46c6jqf
    ◯「カタカナは20文字だけ」「没アイテムで宝箱がカラッポに」 ファミコンハードの限界に挑んだ制作者たち ねとらぼあ
    nlab.itmedia.co.jp/nl/articles/1801/07/news008.html
    【サポーターコミュニティ加入はこちらから】
    yurugengo.com/support
    【おたよりフォーム】
    forms.gle/BLEZpLcdEPmoZTH4A
    ※皆様からの楽しいおたよりをお待ちしています!

  • @ihatovoihatovo1732
    @ihatovoihatovo1732 Před 11 měsíci +97

    以前、吐噶喇列島の島に住んでいました。住居表示は鹿児島県鹿児島郡十島村〇〇島〇〇番地 となっていました。

  • @mudaso-heavy-user
    @mudaso-heavy-user Před 11 měsíci +175

    言語沼の件あってのこのシリーズ、エモい

  • @TonyStark_85
    @TonyStark_85 Před 11 měsíci +82

    5:54 「ぬるぬる」なんて頻繁に言わないと言ったすぐあとに「ぬるっとしちゃう」が堀元さんの口から発されている

    • @nazo_no_message
      @nazo_no_message Před 11 měsíci +14

      その字幕が「nuるっとしちゃう」になってたら300万融資した(ウソ)

    • @1joker141
      @1joker141 Před 10 měsíci +11

      nuるnuるPを存在しないって言ったときにnullとかけてるのかなってちょっと思いました

    • @user-oz2cf1xd3k
      @user-oz2cf1xd3k Před 16 hodinami

      ぬるぽ

  • @user-ct9sr9id3u
    @user-ct9sr9id3u Před 11 měsíci +70

    ドレミの歌以外で
    「『喇』は『喇叭』の『喇』」って言うことあるんだ

  • @184a-xx8km
    @184a-xx8km Před 11 měsíci +47

    15:30
    ポケモンはバーチャルコンソールも含めるとと全シリーズから最新作にポケモンを移送できるんだけど、
    GBは「ヘ」の平仮名とカタカナの文字コードが同じで、移送するときに他の文字で判断して文字コードを平仮名かカタカナどっちかに変換する機能がついてたりするらしい。
    ポケモンっていうゲームだけ容量が少なかった時代の遺産がまだ残ってるんだよね

  • @magical_hippopotamus
    @magical_hippopotamus Před 11 měsíci +86

    「ほっけ」を漢字で表すと魚編に花で「𩸽」なのですが、これはサロゲートペアといってUnicodeの中でも1文字16bitに収まらなくて拡張された少し特殊な字の1つです。扱いに注意が必要と言われていました。
    文字コード回でほっけのTシャツを着てくる堀元さん、流石ですね。

    • @taturou
      @taturou Před 10 měsíci

      サロゲートペアを処理するコード書いたことありますが、あれはイヤだった。UTF8が発見されて良かったです。日本語は3バイトになりがちでムカつくけど。

  • @Fnak202
    @Fnak202 Před 11 měsíci +101

    初代ドラクエで採用されたカタカナは 20 文字+「ド」の 21 種類で、「リ」「ヘ」は平仮名で代用するため、収録文字数は 19 文字となっています。
    ちなみに、その 20 文字の中に「ク」は入っていません。(物語中に「クエスト」という単語は出てこない。)
    有名な話では、「ダースドラゴン」というモンスターは、アイデア段階では「ダークドラゴン」という名前だったというのがあります。
    また、水野さんが仰っていた呪文「メラ」はスタメン張っていたという話ですが、実は初代ドラクエに「メラ」は登場していません。
    初代ドラクエに登場した攻撃呪文は「ギラ」「ベギラマ」の 2 種類だけで、「メラ」が初登場したのはⅢですね。

    • @subratte256
      @subratte256 Před 10 měsíci

      また初代ポケモンでは「り」「へ」以外のひらがな・カタカナと「゛」「゜」「…」「ど」「ィ」「円」「!」「?」「 」とプログラムの仕様で生まれた終端文字なるもの(透明)、0~9、A~G辺りまでのアルファベット(背景のチップとして使用していたりもする)で256文字分(1文字当たり1byte)になっていたりします。よくバグらせると゛だらけになったりアネ゛デパミ゛みたいた名前が生まれたりするのもプログラムで「が」や「ぱ」を疑似的に再現していたからこそ生まれていたりしていると考えられます。(「と」の上に「゛」をつける普通バージョンだと上のポケモンのステータスなどの表示に影響が出るため?「ど」は1byteの大きさに収めるための文字でポケモンのステータス画面でのみ見られます。)

  • @nanoriKYDO
    @nanoriKYDO Před 11 měsíci +47

    繧繝 同じ色を濃から淡へ、淡から濃へと層をなすように繰り返す彩色法(デジタル大辞泉より)
    初期のDQでは「モンスター」が使えない(「モ」が無い)ので「まもの」と表記したとか

  • @koi506
    @koi506 Před 11 měsíci +41

    昔、フォント作成PJに関わったことがあります。
    文字コードは設定されてても第1水準から作っていくので、最初は無い無い尽くし。
    第2、第3と進むとだいぶスレてきて高頻度を優先的に作る方式になりました。

  • @sabak7390
    @sabak7390 Před 11 měsíci +38

    弁が3つの文字が合流していたのは初耳。ぜんぶ「弁える」の意味だと思ってた。
    智弁和歌山の弁はもとは辯で、弁護士や弁論と同じ源だったんですね。
    久しぶりに面白かった脱線話でした。

  • @thesaito2721
    @thesaito2721 Před 11 měsíci +36

    コナンくん「札幌に住んでるのに円山動物園ではなくてわざわざ旭山動物園…? 妙だな…」

  • @mudaso-heavy-user
    @mudaso-heavy-user Před 11 měsíci +33

    ドラクエの話だと、ダークドラゴンを出そうとしたけど容量的にカタカナのクが使えないからダースドラゴンになったって話があった気がする

    • @masuo64
      @masuo64 Před 11 měsíci +7

      むだそすん!

    • @mudaso-heavy-user
      @mudaso-heavy-user Před 11 měsíci +3

      @@masuo64 カタカナの話ね、ひらがなは使えるんやでwww

  • @squandered3589
    @squandered3589 Před 11 měsíci +18

    「円マーク円以外に使わんしね」
    元も同じ記号ですね。海外通販で円表記だと思って買ったら元だった、
    といったケースがあり、問題になっています。

  • @yu100nabeyan
    @yu100nabeyan Před 11 měsíci +18

    2人とも緑Tシャツお揃でかわいい

  • @user-we2xe2vv1v
    @user-we2xe2vv1v Před 11 měsíci +28

    ドラクエ1の攻撃呪文はギラとベギラマしかないです(キメラがいるのでメラは出せるけど)
    「ダークドラゴン」というモンスターを実装しようとしたところ、「ク」が使えなかったので「ダースドラゴン」という謎の名前になったそうです。
    なぜかドラクエ3になって「ク」が使えるようになったあとも「ダースリカント」という新モンスターが登場したので、「ダース」という架空の形容詞を冠したモンスターは2体います。

  • @doridoriization
    @doridoriization Před 11 měsíci +87

    難読語の漢字は書けるがその意味を知らない水野氏と漢字を図形と認識するもその違いが曖昧な堀元氏。よいコンビである。

  • @nanaki1006
    @nanaki1006 Před 11 měsíci +14

    繧繝(うんげん)、後学のために調べてみました。雛人形の載ってる畳の縁に付いてるカラフルな模様のあれ。

  • @xitianzhenwu6756
    @xitianzhenwu6756 Před 11 měsíci +27

    外来語の音訳であることを示すために、口偏を使ってたので、トカラ(奄美地方の言葉が由来)に漢字を当てる際に、音を表す声符に口偏を付けて吐噶喇となっています
    喇叭も同様

  • @user-fe3vn9wr1f
    @user-fe3vn9wr1f Před 11 měsíci +24

    パソコンで文字を入力していると文字コードにに入ってない文字が〓(下駄記号)になって出てくることがあります。これは活版印刷の時、必要な活字がないとき不要の活字を上下さかさまにして仮置きし、その底面がゲラ刷りしたとき〓に見えたので、〓が文字コードに存在しない文字の代替文字になった。ちなみにこれを「下駄を履かせる」というそうです。

  • @nandemotsukuruyo
    @nandemotsukuruyo Před 11 měsíci +26

    14:55
    ちなみに「ク」も「エ」も未収録なのでゲーム会話中では「ドラゴンくえすと」と表示されます。

  • @user-ff7sz4ql5p
    @user-ff7sz4ql5p Před 11 měsíci +6

    瓣(花弁・安全弁)と辯(雄弁・大阪弁)は分かりやすいけど
    正しいか否か分ける/弁えるを意味する辨(弁別・勘弁)に該当する漢字だけ
    区別するのかなり難しくね?
    弁当は物理的な境や蓋なので瓣かと思いきや辨だし
    弁証法・弁護士・弁舌・弁論・弁説・詭弁・弁解・弁明
    は一見全部コトバ関係なのに最初と最後だけ辨で違う。
    さらに弁理士や弁償するの弁は
    辨(わきまえるの意)ですらなく4文字目の辦(処理するの意)
    そしてダメ押しのように5文字目の辮(編むの意、弁髪)まである。
    一周まわって一緒にしてくれた先人に感謝かもしれん、
    全部バラバラのままだったらきっと自分は発狂してた…

  • @koolongkoolong
    @koolongkoolong Před 11 měsíci +62

    水野さんは文字コードを文字化けの原因として認識しているし、横隔膜はしゃっくりの原因として認識している

    • @haine102
      @haine102 Před 10 měsíci +6

      ただし、横隔膜がどこにあるかわからないし、しゃっくりのメカニズムもわからない。

  • @user-rp1bv9cn2c
    @user-rp1bv9cn2c Před 11 měsíci +16

    ドラクエの「ク」は初代には無い文字で、ダークドラゴンをダースドラゴンとして登場させたのは有名な話ですね。

  • @Irix.5674
    @Irix.5674 Před 11 měsíci +12

    自分も違いをちゃんとは理解していないから説明ができないんだけど
    文字コードとエンコードは別物なのに混同されて一緒くたに
    扱われることが非常に多い。
    UTF-8 や Shift_JIS はエンコードで正確には文字コードではない。
    UTF-8 は文字コードである Unicode のエンコード方式のひとつ、
    Shift_JIS は文字コードである JIS コードのエンコード方式の
    ひとつです。

  • @fx-702p
    @fx-702p Před 11 měsíci +10

    「包摂基準」は「包摂規準」と書くべき、みたいな話をJIS漢字の委員会の人が言ってた気がするんだけど、ずっと混用されて続けてる(総務省や法務省も基準を使ってる)。

  • @user-nh9xk1rc8u
    @user-nh9xk1rc8u Před 11 měsíci +34

    ISO感度はISOの初期の規格であるISO100に基づく規格なので関係あります

  • @user-tq9eg4gg6v
    @user-tq9eg4gg6v Před 11 měsíci +36

    幽霊文字の回楽しみすぎる…。漢字字典(≠漢和辞典)読んでると定期的に語義未詳の字が出るし、それがUnicodeとかでも起きるのは結構自然な結果でもあるよなぁ。幽霊文字クリシェはきっと折り目が線に見えた妛とか誰もミスの原因をしらないという彁とかかな?

    • @user-uf5qg4ik5j
      @user-uf5qg4ik5j Před 11 měsíci +4

      Unicodeは、2バイトコードと4バイトコードがある。
      アラビア文字は、4バイトコードで表現し、日本語は、2バイトコードで表現している。

    • @kumamushi3
      @kumamushi3 Před 10 měsíci +1

      予想通りでしたね!

  • @tenrai3065
    @tenrai3065 Před 11 měsíci +17

    半角カナの呪縛とか、EBCDICやEUCとか、shift-JISはなんでシフトなのかとか、コードページってなにとか、最初の文字コードは5ビットだから32文字だぜとか、超漢字ってあったよねぇとか、文字コードのネタはそれだけでチャネル作れるほどありそうです。

    • @Q0rx5kn5oSE
      @Q0rx5kn5oSE Před 11 měsíci +3

      ゆる文字コード学ラジオ待ったなし

  • @mudaso-heavy-user
    @mudaso-heavy-user Před 11 měsíci +13

    楽しみに待ってました

  • @user-wy8nq3js5f
    @user-wy8nq3js5f Před 11 měsíci +12

    Bと13では、鋼の錬金術師のお話に、存在しないはずの13号倉庫がある!?→昼見に行ったら実際はB倉庫でペイントされたBが1と3の組合せみたいなフォントで夜暗かったせいもあって、13号と勘違いしたってオチの話があったはず

    • @senkobayashi1307
      @senkobayashi1307 Před 11 měsíci +4

      ありましたね、単行本のおまけに入っていた気がします

  • @PhodraX4
    @PhodraX4 Před 11 měsíci +9

    10:35 吐噶喇の喇を説明するのに喇叭を例示してるのに喇叭の喇を説明するのに吐噶喇の喇って言っちゃうの実に水野さん

    • @Aros417
      @Aros417 Před 10 měsíci

      循環参照だ

  • @user-zj4cv4gy1z
    @user-zj4cv4gy1z Před 11 měsíci +4

    トカラ列島は十島村ですね。
    日本で1番長い市町村だったり、日本で唯一領域外に役場あがある市町村だったりと雑学に事欠かない土地です。

    • @user-zj4cv4gy1z
      @user-zj4cv4gy1z Před 11 měsíci

      領域外に役場がある市町村は他にもあった・・・

  • @koi506
    @koi506 Před 11 měsíci +10

    文字コードが同一でもフォントによって文字が違うことはあり得ます。
    主流のアウトラインフォントではあまり見られませんが、ビットマップフォントではあえて嘘字を作成することがあります。
    ドット数の限界を超えた画数に対応できず、見た印象で漢字を識別するという区別のしかたをしてもらうためです。「感字」と呼んでいました。
    旧字でも新字でもない「そのフォント以外無い漢字」を表示するので、字を調べる用途では注意が必要です。

  • @KIKKOMANamawa
    @KIKKOMANamawa Před 11 měsíci +5

    以前コンビニでバイトをしていた時、住所の代筆を頼まれたのですが
    「岐阜県揖斐郡」って普段書かない漢字ばかりで手に汗握った思い出があります

  • @Bisco-le1rt
    @Bisco-le1rt Před 11 měsíci +10

    ダルい駄菓子屋のおばちゃん「はい、じゃあおつり30万¤!」

  • @user-vu1ie8jj9s
    @user-vu1ie8jj9s Před 11 měsíci +2

    5:58
    「ぬ」要らない言うてたのにぬるっとしちゃう堀元さん

  • @yoshi46-319
    @yoshi46-319 Před 11 měsíci +14

    文字コード制限で、いまも影響が残っているのは円記号とバックスラッシュの問題ですね。windowsのフォルダの区切りが円マークなのは見にくいと個人的には思います。ちょっと話は違いますが、波ダッシュも話がややこしいですね~。

    • @user-hq5ei9nx3u
      @user-hq5ei9nx3u Před 11 měsíci

      アスキーアートをロゴにしてるツールとかも、ロゴが円マークだらけになって悲しくなるよね

    • @masuo64
      @masuo64 Před 11 měsíci

      波ダッシュ、win7だかwin8で打たれたテキストだと、未だに変なフォントになるのに、打った本人は気づいてないんですよね。

  • @furusatonotkokyou
    @furusatonotkokyou Před 11 měsíci +5

    30:11
    常用漢字の中でも、後から追加された「遡」とかは常用漢字でも点2個ですね

  • @24852
    @24852 Před 11 měsíci +14

    私の年収は¤0です。
    これでうまく誤魔化せたな。

  • @JackieMatthews610318
    @JackieMatthews610318 Před 10 měsíci +1

    32:29 今、堀元氏と全く同じ反応してから、1933(昭和8)年に弁理士資格取った父が言ってたことを思い出した。当時ガキンチョだった私には何のことやらさっぱりわからんかった。「弁理士とはな、弁護士と違って『ことわり(理)をわきまえる(弁=辨!)』仕事なんだ」…その後「弁護士は喋るばっかり」とか謎のdisりをしていたのも「辯」からだったのか…と、多分半世紀弱ぐらいで初めて納得しました‼️
    ちなみに父、早稲田大学政治経済学部卒。ソニーの創業者、伊深大氏と同窓だったとよく自慢しておりました。

  • @----___----___----___----___--
    @----___----___----___----___-- Před 11 měsíci +12

    International Organization for Standardization の略ならIOSやろがいと思ってググったら
    明確な由来がなく、私が世界統一した際は滅ぼそうと決めた

    • @francescogatti3002
      @francescogatti3002 Před 11 měsíci +1

      iOSが世界を席巻すると未来予知したのかもしれない。

  • @TokumeiResearch200X
    @TokumeiResearch200X Před 10 měsíci +3

    最近はsjis(≒ms932)とUTF-8とUTF-8(BOM)くらいを気にすれば良いけど、古いものだとEUC-JPとか気にしたりしてましたね
    あと文字コードのこと調べてると英語圏の人が文字コードの事なんも考えてないんだろうなと思うことがよくある

  • @user-su4bs2eq8w
    @user-su4bs2eq8w Před 11 měsíci +9

    祖母が祖父のことを「お父さん」と呼ぶのを「じいちゃん」でしょ!って訂正してたのを思い出した

  • @ellnore_pad
    @ellnore_pad Před 8 měsíci

    北海道出身にして現役プログラマーである俺得回。
    そして、お二人の切り口が自分にはない視点からの切り口で、国際通貨某のワイルドカード的な記号に対して「単語と同じだね」って言う話に繋がったのが凄く面白くて新鮮だった。
    ちなみに「おささる」とか「おささっちゃう」はある程度否定的なニュアンスというか、不都合であるみたいな意味合いが含まれてることが多く、
    「押すつもりはないのに(構造上の欠陥とかで)意図せず押してしまう」みたいな時に「(押そうとしてないのに)押ささっちゃうんだよこれー!!」とか言いますね。

  • @user-dm1ln6uw3q
    @user-dm1ln6uw3q Před 11 měsíci +7

    𦚰(肉月に刀三つ)を脇(肉月に力三つ)と間違われるとご先祖様に申し訳なくなるので本当につらかったけどJISレベル4で収録されて歓喜したことは懐かしい。

  • @jyozu
    @jyozu Před 11 měsíci +4

    ファミコンが若い人にも知られていたら、導入で伝えようとしていた
    収録できている文字のイメージがつきやすいんですけどねぇ。

  • @ameatokua
    @ameatokua Před 11 měsíci +5

    ゆる言語学ラジオの内容が入ります。 27:1033:49
    水野さんの話が面白いので、聞き入りますね。

  • @user-fv8gf8vi5f
    @user-fv8gf8vi5f Před 11 měsíci +9

    文字コードにないエピソードで、声優の朴璐美さんの璐が出せないから王路で代替しているのをよく見かける。

    • @passute
      @passute Před 11 měsíci

      野球好きなら
      李承燁の火へんに華とか
      李机浩の木へんに凡とか
      そういう話かな

    • @_tatibana1243
      @_tatibana1243 Před 9 měsíci

      鬼滅の刃のネズコも字が出せなくて代替しているのを見ましたね。
      鬼滅ファンから誤字として指摘を受けるのか。名前が出る全ページに※で注釈が付いていた

  • @roadevery9434
    @roadevery9434 Před 11 měsíci +4

    さらに合流した弁の字は元々は違う字としてあったと言う話もありますね

  • @atsushigrizlupo8479
    @atsushigrizlupo8479 Před 11 měsíci +1

    「この文字とこの文字は同じである」と判断する仕事は本当に面倒です。
    「これはデザイン差なので同定してよい」とかいう言葉が飛び交います。
    ちなみに総務省の包摂基準はけっこう緩いです。

  • @maruneko35
    @maruneko35 Před 11 měsíci +3

    待ってました。絵文字や異体字セレクタのややこしい話が出てくることに期待。

  • @tatsutakaraage2662
    @tatsutakaraage2662 Před 11 měsíci +16

    6:00 あーここほんと面白いw
    コンビ芸なんよw 円熟味増してるわーw

  • @halyur33
    @halyur33 Před 11 měsíci +2

    このチャンネルでプロジェクトヘイルメアリーに出会い、火星の人を絶賛読書中の私には文字コードの話題はめちゃめちゃタイムリーです
    ちなみに道民ですが、【押ささる】は
    ・つい押したくなってしまう
    よりもどちらかというと
    ・(誤って手が触れて)押してしまう
    の方がニュアンスちかいかな~と思ってます

  • @bicks123
    @bicks123 Před 11 měsíci +3

    昔QuizKnockのチャンネルで、「東大生なら文字化けしてても読める」ってやってましたね。

  • @murayan68k
    @murayan68k Před 11 měsíci +6

    ドルとポンドは当時から基軸通貨としての立ち位置があったので独立させたほうが都合良かったとかじゃないのかな

    • @francescogatti3002
      @francescogatti3002 Před 11 měsíci +1

      その理屈だと円も必要やろ!ってなりそうな。円も強かったんやで、今じゃ考えられんが。

    • @user-ej4br8gb5v
      @user-ej4br8gb5v Před 10 měsíci

      ASCIIが制定されたのは1963年、
      そのISO版が数年後くらいじゃなかったっけ。
      まだ円が強い時代じゃなかったよ。
      JISコードだと0x5Cに\の代わりに¥が
      割り当てられていていろいろ不便だった。

  • @haine102
    @haine102 Před 10 měsíci

    「ぬるぬるとか言えなくて良い」の後にさっそく「ぬるっと」って言い出しちゃう堀元さん。

  • @pozo20
    @pozo20 Před 11 měsíci +4

    最近知った、洗浄は洗滌と書いてで"せんでき"と読んだけど"せんじょう"と読まれる事が多く滌が常用漢字に入らなかったため、洗浄と書かれるようになったとか
    漏洩はもともと、ろうせつと読むけど曳の"えい"にひっぱられてろうえいと読むとか
    は関係ないですね

  • @zr258
    @zr258 Před 11 měsíci +2

    データベースの回で、「朝涼」とかの項目名をすべて番号づけるための表を別で作って、本体の表には番号の数字しかないっていう状態が、今考えると文字コードに似ているな、と。

  • @tambaren
    @tambaren Před 11 měsíci +2

    ドラクエの世界で出てくる、アレフガルドという地名は
    パッケージで説明されるけど、アとフが収録されてないせいでゲーム中では言及されない

  • @tayashoki1831
    @tayashoki1831 Před 11 měsíci +5

    弁護士の辨
    弁理士の辯
    花弁の 瓣
    中国語では簡体字にするときに纏められたりもせず、それぞれ存在し続けているようです

  • @user-of5un8oi9g
    @user-of5un8oi9g Před 11 měsíci +2

    弁当の弁は「配膳する」から分けるの意味の「辨」みたいですね。

  • @HigashiJuicy
    @HigashiJuicy Před 11 měsíci +2

    地元の新潟では「タオルなど長めの布などの先端が、地面に引きずられている」という現象を【しびいている】と言っていました。
    標準語にはこの言葉が存在しなくて困る

    • @haine102
      @haine102 Před 10 měsíci

      ポケモンの細長い電気タイプのシビ◯◯ってそれもかかってそうだな

  • @user-gr5il5ko1c
    @user-gr5il5ko1c Před 16 dny

    繧繝は繧繝模様、畳の繧繝縁の時しか使わない気がします。暈繝でもよいはずです。

  • @田中舘
    @田中舘 Před 7 měsíci

    自分は青森出身で「〜〜ささる」を「〜〜しようとしていなかったはずが、なぜか〜〜してしまう」という意で使用ささるのですが、これは「〜〜を自然にしてしまう」の応用と考えました。

  • @hykathon
    @hykathon Před 10 měsíci

    33:25 サロゲートペアの話への布石ですね。
    こういう伏線を見つけるとワクワクしますね!!

  • @his58enc8odk310
    @his58enc8odk310 Před 7 měsíci

    13とBの話はハガレンで似たような話を扱った回があったな。
    軍の倉庫で存在しない13番倉庫が現れる噂があったけど、Bがデザイン上、1と3に見えただけだってやつ

  • @riorio1580
    @riorio1580 Před 3 dny

    13とBを同一にみなすのは恐らく1337表記の話から派生してますね...

  • @tenkawakiirobou
    @tenkawakiirobou Před 11 měsíci

    やっと来た!楽しみに待ってました

  • @takpon9261
    @takpon9261 Před 11 měsíci

    これ期待してた、超待ってた

  • @user-du4lc5pu4g
    @user-du4lc5pu4g Před měsícem

    ドラクエの容量削減の逸話だと、「ダースドラゴン」の一件があります。
    本当は「ダークドラゴン」としたかったところ、容量削減のために、ストーリー進行に問題がない、片仮名の「ク」を削除したらしいです。

  • @shindy_jp
    @shindy_jp Před 11 měsíci +2

    ペアルックっぽいことに気が取られて内容が頭に入ってこない!

  • @moonsnowknight
    @moonsnowknight Před 2 měsíci

    漢字は字体が問題になるけれど、実はアルファベットにも字体の違いがあってこちらはグリフ(?)の違いとして扱われていますね。小文字aに角のあるものとないもの、gがめがねのレンズ2つになっているのと、1つのもの…。
    漢字の書体字典なんかみると、同じ漢字なのに少しずつ異なるものがいくつも並んでいます。時代や地域あるいは人によって形が異なっていたのでしょう。康煕字典で字体を統一したことがあったようですが、これは印刷用に造られた字体に思います。書道やってる人は気づくと思うけれど、筆で書くときは少し変わった形なることがありますね。
    しんにょうが1点か2点で意味が変わることはないので同じ字としてもいいと思うのですが、漢字の簡略化なんかの歴史が関係してきて基準を決めにくいのでしょうね。

  • @user-by9oi7jz3c
    @user-by9oi7jz3c Před 11 měsíci +1

    昔のPCは第二水準漢字ROMが別売りとかあったな。懐かしい話だ。

  • @h.t3996
    @h.t3996 Před 10 měsíci +1

    文字コードって昔からいろんな種類があった。
    半角
     BCDコード→ASCIIコード(Unix、PC)
          →EBCDICコード(IBMなどのメインフレーム)
    全角(日本語独自規格)
     ASCII系→Shift-JIS(PC)、EUC(Unix)
     EBCDIC系→IBM漢字、JEF(富士通)
    世界共通
     UTF-8
    異なる文字コードの場合は必ず文字変換を行い、変換不能な文字コードがあると文字化けします。そもそも文字コードを間違えてファイルを開くと文字化けしまう。
    初期の頃のメールで半角カタカナが文字化けしたのは、PC側がShift-JISでメールサーバがEUCだったためで、Shift-JISは半角カタカナを1バイトで割り当てているのに、EUCでは半角カタカナが2バイトで割り当てられていました。今はメールサーバがUTF-8なので、Windows側がShift-JISでも半角カタカナの文字化けはなくなりました。
    文字コードの中には改行コードもあります。OSによって改行コードも変わるので、エンジニアをしているとトラブル対応の際に改行コードも意識します。

    • @michihirokabata2519
      @michihirokabata2519 Před 8 měsíci

      昔の半角カタカナ等の文字化けは、iso-2022-jp (いわゆるJISコード)で送ると宣言していながらそれに定義されていない文字を使うからで…
      最近はメーラーのデフォがUTF-8だから化けてないけど、iso-2022-jpで送れば化ける可能性があります。

  • @HashimotoHobbyCh
    @HashimotoHobbyCh Před 11 měsíci

    文字コードのISOもカメラのISOもディスクイメージのISOもキーボードのISOも会社が掲げてるISO14001?とかも全部 国際標準化機構ですよー。

  • @user-pq2yw7eq5u
    @user-pq2yw7eq5u Před 10 měsíci

    毎回堀元さんの「○○さる」がそれで合ってるか...?ってなっちゃう...
    人に説明する時は
    「○○さる=○○できる」
    or
    「自分の意思・行動とは反して起きてしまうこと、自分が無関係なことを言いたい」と言ってます。(これで合ってるか分かりませんが)
    「コントローラー握った時にボタン押ささっちゃってさ〜」
    だと
    「コントローラーを握った時に、(押すという意思は無かったが結果)押してしまった」
    的な感じになります。
    よく使うのは「書かさる(さらない)」
    「このペン書かさんないなと思ってたけど、紙にグリグリやってたら書かさったよ」

    「このペン(自分の行動とは関係なく)書くことができない状態だったが、紙にグリグリしてたら書けるようになった」
    「○○さる(さらない)」は自分の行動と関係なく最終的に起こったことを言っている感じがするので視点?が自分ではなく物にあるのかなあ?という感じがします(学がないのでこれで正しいか分かりませんが)。
    「洗濯機に服入れる前にボタン押ささった」
    だと、気付かずに押したわけではないんだなという感じがします。逆に
    「洗濯機のボタン押ささんないな」
    だと実際にはポチポチ押しているんだなという感じがします。

  • @abeechannel6805
    @abeechannel6805 Před 11 měsíci +8

    昔、住民票を電子化する仕事してました
    文字コードに存在しない文字が使われてる人には住民票を出力する際に一言付されるようになってます(たしか)

    • @francescogatti3002
      @francescogatti3002 Před 11 měsíci

      母親はそのせいで改名しました。惠から恵へ。

  • @keisukesugi5085
    @keisukesugi5085 Před 11 měsíci +1

    弁のほかにも芸とかも合流してますね

  • @user-pi1er7zx3m
    @user-pi1er7zx3m Před 11 měsíci +2

    辯、お前どっかで会ったことあるな…?
    あ、弁髪の弁だ!!と思ったけど弁髪の弁は辮でした。
    誰だお前!!

  • @Twilingal
    @Twilingal Před 11 měsíci +1

    「押ささる」は便利

  • @gorotlavis2495
    @gorotlavis2495 Před 23 dny

    Bと13のくだりはアニメ版のハガレンの怪談話回で見たことありますね

  • @canon1729
    @canon1729 Před měsícem +1

    24:22 アフォーダンス九大プレ模試で出た‼️一般語彙とは言わせない‼️

  • @matano-0419
    @matano-0419 Před 11 měsíci +1

    同じような色の服を着ているせいで二人がペアルックに見えて気になって仕方がないw

  • @user-pn6tf6kf9u
    @user-pn6tf6kf9u Před 6 měsíci

    「おささる」についてですが、積読チャンネルでチャン(堀本)さんが紹介されていたテッドチャンの小説、予期される未来に出てくるランプが光ったら1秒後に必ずボタンを押してしまう玩具に当てはまりますね。
    でも現実で自分の意思とは関係なく行動してしまうことって?と思うので、道民の方はどういうシュチュエーションでこの言葉を使うのかすごく気になります。

  • @user-mj9gx1jg6s
    @user-mj9gx1jg6s Před 11 měsíci +6

    中国では「¥」は人民元を表します。中国出張後の旅費清算では注意が必要です。

  • @yt-system1372
    @yt-system1372 Před 11 měsíci +3

    辻とか樋口の「樋」は、戸籍上明確に別字と扱われ、圧倒的に一点之繞の方が多いと思われますが、これを電子媒体で表示できない(CSSでfont-variant-east-asian:jis90;を指定してやればWEB上の表示はできますが)のは、非常に問題だと思います。斉藤の「斉」渡辺の「辺」は、非常に多くの字体が別字として扱われることに比べると非常に不合理を感じます。

    • @早川眠人
      @早川眠人 Před 11 měsíci +2

      IVSの異体字セレクタU+E0100〜U+E01EFを使いましょう

    • @yt-system1372
      @yt-system1372 Před 11 měsíci

      @@早川眠人さんありがとうございます。いろんなサイトで調べてみましたが、なかなか難しそうです。使い方をやさしく解説したページをご存じでしょたらお教えください。

    • @早川眠人
      @早川眠人 Před 11 měsíci

      @@yt-system1372
      「IMEパッドで異体字セレクタを利用する」でggr

  • @kicyoh3390
    @kicyoh3390 Před 11 měsíci +1

    いつもモノクロ服なのに、今日どっちも緑なのはなんかの伏線なのか?

  • @hy7207
    @hy7207 Před 26 dny +1

    19:48 実は中国元も円マークです。

  • @user-ei8cl1wl3r
    @user-ei8cl1wl3r Před 11 měsíci

    草なぎ(なぎの漢字は弓へんに剪)剛
    っていう表記をニュースの時とかよく見た思い出。ええ、あのニュースとか

  • @haine102
    @haine102 Před 10 měsíci +1

    言語が理系っぽくて、文字コードが文系っぽい逆転現象。

  • @早川眠人
    @早川眠人 Před 11 měsíci +4

    イタリア語話者なら使わないアルファベットがあるから5文字程省ける

  • @user-pi1er7zx3m
    @user-pi1er7zx3m Před 11 měsíci

    13:12 なんだその認識あったのかという驚き

  • @user-og8sd2ei3g
    @user-og8sd2ei3g Před 11 měsíci

    文字コードは文字の話なだけあって、水野さんの引き出しが多いですねえ

  • @tatsuaki.takahashi
    @tatsuaki.takahashi Před 11 měsíci +3

    Zをパージしてしまうと Zamenhof の回が作れなくなってしまって困るのでは? > 水野さん

  • @gunhasirac
    @gunhasirac Před 10 měsíci

    中国語学べばこのチャンネルの考察の深さ10倍深くなりそう、と弁の話面白がりながら思った

  • @masakio5367
    @masakio5367 Před 11 měsíci

    静岡の薩埵峠もよく「さった峠」と仮名書きされますよね。

  • @100EIZO
    @100EIZO Před 11 měsíci

    鹿児島県、十島村の悪石島が舞台のルポルタージュ「美女とネズミと神々の島」は名作です。

  • @guranora
    @guranora Před 10 měsíci

    北海道、東北方言の「〜ささる」は大変面白いので是非それで一回やってみてほしいです。文法的には中動態、古典文法における自発の「る、らる」に由来するものだと個人的に推測しています。言語の伝播が同心円状に伝わるということからすると、例えば沖縄にも同じような表現が残っていたりしないでしょうかね

  • @mbk1743
    @mbk1743 Před 11 měsíci +1

    文字コードの制約が原因でPCやスマホに表示される漢字が唯一の正解の様に扱われて
    漢字が書けない、混同して覚えている、間違った使い方が一般化される等々、色んな物が失われている気がします。
    これも歴史の中で起きる言語の変遷の一部なんだろうけど自然発生的ではなく極めて人為的な変化なのが面白いですね。
    こんな調子で100年後の日本語がどんな事になってるのか若干興味があります。多分殆ど通じないんだろうなぁ。