バックスラッシュ＝円記号問題は誰のせい？文字コードに日本人が振り回された歴史【電脳史学】

ゆる学徒ハウス別館

zhlédnutí 17 561

Přidat do
- Můj playlist
- Přehrát později
Sdílet

Sdílet

Vložit

Velikost videa:

Zobrazit ovladače přehrávání

Automatické přehrávání

Přehrát

čas přidán 23. 07. 2024
ゆるコンピュータ科学ラジオに物申しながら、文字コードの歴史を語っていきます。米国ジャイアニズム……！
*おことわり
途中､「中華フォント問題」について言及する部分があります。その中で「中華フォントが気持ち悪い」という発言が何度か出てきますが、これは日本語環境下で普段と異なる字体が意図せず表示されてしまうことで感じる違和感について語ったものであり、中国で使われる字体を貶める意図のものではないことをご承知ください。出演者は、各国の文字文化を尊重しつつ、それぞれの環境で適切な文字表示のできるコンピュータ環境を望んでいます。
■ 出演者
○ スミノコウヤ（ゆる電脳史学徒）
→個人チャンネル： / @webnostalgia
○ 有洲ケイ（ゆる料理学徒）
→個人チャンネル： / @alice.k
■ 関連動画
○ 存在しない漢字を、なぜ入力できるのか？世にも恐ろしい技術的負債の話。【文字コード3】#94
→ • 存在しない漢字を、なぜ入力できるのか？世に...
○ ゆるコンピュータ科学ラジオ・文字コード編再生リスト
→ • 文字コードを深掘りする。文字化けはなぜ起こる...
■ 参考文献・資料
○ ECMA 7-bit coded Character Set
→www.ecma-international.org/wp...
○ ISO 646 7-bit coded character set for information processing interchange
→cdn.standards.iteh.ai/samples...
○ Backslash - Wikipedia
→en.wikipedia.org/wiki/Backsla...
○ MZ (コンピュータ) - Wikipedia
→ja.wikipedia.org/wiki/MZ_(コンピュータ)
○ ASCII - Wikipedia
→en.wikipedia.org/wiki/ASCII
○ Byte - Wikipedia
→en.wikipedia.org/wiki/Byte
○ MZ-80 SERIES SYSTEM PROGRAM
→ia802709.us.archive.org/4/ite...
○ ISO/IEC 646 - Wikipedia
→en.wikipedia.org/wiki/ISO/IEC...
○ C言語 - Wikipedia
→ja.wikipedia.org/wiki/C言語
○ Emoticon - Wikipedia
→en.wikipedia.org/wiki/Emoticon
○ emoticon | Etymology, origin and meaning of emoticon by etymonline
→www.etymonline.com/word/emoticon
○ Oxford Dictionaries Word of the Year is the tears of joy emoji - BBC News
→www.bbc.com/news/newsbeat-348...
○ Inbox: The Original Emoji, by Shigetaka Kurita | MoMA
→www.moma.org/calendar/exhibit...
○『中国の骨は1本すくない』小田空(著) (集英社クリエイティブコミックス)
→www.amazon.co.jp/dp/4420220465
○ 侍戦隊シンケンジャー
→www.amazon.co.jp/dp/B012DX7XNI
○ アイヌ語仮名 - Wikipedia
→ja.wikipedia.org/wiki/アイヌ語仮名
○『ゴールデンカムイ』野田サトル(著) (集英社)
→www.amazon.co.jp/dp/4088900820
■ ゆる学徒ハウス別館ANNEXについて
メンバーがそれぞれ得意分野を持つ、うんちく・雑学大好き集団。
始まりはゆる言語学ラジオのオーディション企画､「ゆる学徒ハウス｣。
挑戦した中で落選するも､「語りたりない」者たちが集まって立ち上げたチャンネルです。
知的にふざけながら、魅力的なコンテンツを発信していきます。
主に対話形式のラジオ動画を投稿してます！
○《公式サイト》
→sites.google.com/view/yurugak...
○《公式X》
→x.com/yurugakutoANNEX
※収録環境が未だ手探りなため、音声や画像の質が悪い場合があります。ご了承ください。
また、本コンテンツは学徒たちの手作りで運営しているため、本家様ほどのクオリティは出せないかもしれません。
ご意見、ご指摘、ご感想はコメント欄か以下のおたよりフォームよりお願いいたします。
■ おたよりフォーム
→forms.gle/TgH8CQzU4bRerZCz5
※最善を尽くしていますが、個人名を指定してのご質問やご要望には対応できない場合もあります。ご了承ください。
■ 関連チャンネル
○『ゆる言語学ラジオ』
→ / @yurugengo
○『ゆる学徒カフェ』（旧ゆる学徒ハウス）
→ / @yurugakuto
■ BGM提供
○ フリーBGM・音楽素材MusMus
→musmus.main.jp/
○ DOVA-SYNDROME
→dova-s.jp/
■ 目次
00:00 ゆるコンピュータ科学ラジオに物申す！
02:03 古代：48KBのメモリが高級品
04:53 文字コードの乱立とISO 646
08:59 なぜバックスラッシュが問題なのか
12:45 足りないのはメモリだけじゃない！深刻な記号不足
16:10 Windowsと文字コード
21:17 近代：東アジアの受難
25:07 救世主🦸‍♂️の登場
36:30 現代：新たな刺客中華フォント化
45:15 漢字コンテンツで覇権を獲れ！
49:28 多様性と規格化の難しさ
59:51 結論：みんな頑張って
Věda a technologie

Komentáře • 183

@uraQ Před 8 měsíci ⁺⁷⁴
HTMLのエスケープで思い出すのが、湘南乃風『睡蓮花』の歌詞です。
途中に何度か出てくる"
@HANEKAWAhaorenoyome Před 8 měsíci ⁺¹⁴
おもしろ😂
@taki_huuko Před 8 měsíci ⁺⁵
それ経験してみたかったなwwおもろすぎる
@Li2nSo1ngPi2ng Před 8 měsíci ⁺⁵
これほんますこ
@ied88dkc Před 8 měsíci ⁺⁷
「歌詞に『あ』が出たら10％速く歌っていく」やつみたいな感じ？
@ripple777 Před 8 měsíci ⁺²⁴
「WindowsがUnicodeを使うようになったのはつい最近」という発言、「OSのシステムは2023年現在もShift_JISを使用している。」という字幕、いずれも語弊があります。
(後者は語弊というより誤解？)
OS内部でUnicode(UTF-16)が使われるようになったのはWindows NT4.0の時代、1996年のことです。
以降、2023年現在に至るまでファイルシステムNTFS含めて内部的にUTF-16が使用されています。
2019年に起きたのは単に「メモ帳という1アプリケーションが扱う文字コードのデフォルトがUTF-8になった」というだけのことなので誤解なきよう。
@uraQ Před 8 měsíci ⁺⁸
コメントありがとうございます！こちらの動画の編集担当者です。
テロップで補足するにあたり､「2019年に変更されたのはメモ帳アプリのデフォルト文字エンコードで、OSのシステムロケールは現在もShift_JISである」という情報を明記しようとしたのですが、私の理解が不十分でシステムロケールとOS内部での文字コードとを混同したままテロップを制作してしまい、おっしゃる通り不適切な記述になっていました。
正確な情報を提供できず、誠に申し訳ない気持ちです。
このたびは貴重なご指摘をいただき、ありがとうございました！
@shomwoys Před 8 měsíci ⁺¹⁷
ゆるコンは補足回必ずいると思いますw
堀元さんガバいんだもの…
@spike2.tracker Před 8 měsíci ⁺⁵³
ゆるコンピュータ科学ラジオ、量子コンピュータ回のLE0さんみたいに常に小窓にスミノさんが控えていてほしい気持ちがある。
@pakupaku-shodo Před 8 měsíci ⁺³
めちゃくちゃわかります！
スミノさん控えててくれたらものすごい安心感もって聞けますよね！！
@smnky Před 7 měsíci ⁺³
ありがとうございます。
僕は台本を脱線させまくるので呼ばれない気がします笑
そのかわり知見を求められれば協力しますよ。2000年問題のときのように。
@opaiopai881 Před 4 měsíci
@@smnky？はい？
@user-hk3dm6my8t Před 8 měsíci ⁺¹⁹
ゆるコンのバックスラッシュの件、自分もモヤモヤしてました。スミノさんにちゃんと解説してもらえて良かったです。
@smnky Před 7 měsíci
コメントありがとうございます。いただいた反応の大きさから「モヤモヤしていたのは自分だけじゃなかっただな」と思いました。
@watashi-wa-tawashi Před 8 měsíci ⁺¹⁵
海外インディーゲームやってると頻繁に中華フォントに遭遇するので本当に何とかしてほしいですね…
英語圏の開発者向けに中華フォントについて説明している"Your Code Displays Japanese Wrong"というページもあるのでもっと広まってほしい
@smnky Před 7 měsíci ⁺¹
開発・修正コストと（日本人の）マーケットへの影響の小ささが問題なのでしょうね。そのへんの言語対応がもっと簡単にできるフレームワークが登場してほしいです。
@nekoyamawataru Před 8 měsíci ⁺²⁸
ゆるコンピュータ科学ラジオの知りたかった背景部分をかなり補足されててめちゃくちゃ聞いて良かった回でした。
ベトナム語は現在ラテン文字を使ってますが、声調やベトナム語特有の音を表すために文中にたくさんダイアクリティカルマークを使うようになっていて、これはこれで大変だなと傍から見てて思います😅
@rti7743 Před 8 měsíci ⁺⁶
ベトナムのアスキーコードvisciiは凄まじいからなあ。
とにかく頑張って文字を詰め込んで割り当てた感がある。
0x80以降だけではなく、 0x02 0x05 0x06 0x14 0x19 0x1E にも文字を割り当てているし。
@smnky Před 7 měsíci ⁺⁴
声調を文字に反映する言語は大変ですよね。英語のようにダイアクリティカルマークを用いない言語は珍しい気がしますが、そういう点でもまさに計算機と相性の良い言語だと思います。
@Desuke12 Před 8 měsíci ⁺¹⁷
学徒の補強動画嬉しいです😊
ゆるコン見るたびにスミノさんの顔がチラつきます😊
昔の話題がでるたびにきっと何か言いたくなってそうだと思ってました😆
@smnky Před 8 měsíci ⁺⁹
ご明察です。たまに別館内部のチャットでひっそりと補足をいれてます。今回はそれを拾ってくれたケイさんが動画化をすすめてくれて公開の流れになりました。
@HANEKAWAhaorenoyome Před 8 měsíci ⁺⁸
お二人の話、とても興味深かったです😊
@harukat Před 8 měsíci ⁺⁶
中華フォントのチャプターのキャプションが中華フォントになってるの凝ってる…
@smnky Před 7 měsíci ⁺²
本動画の編集をしてくれたuraQさんはそういう面白小ネタをはさんでくるのが上手いんですよね～。
@早川眠人 Před 8 měsíci ⁺¹⁸
CP/Mでコマンドに渡すスイッチ記号が/だったから、互換性を維持したままMS-DOSに階層ディレクトリを導入する為にはパス区切りに/が使えなかった。(T_T)
@smnky Před 8 měsíci ⁺²
あぁ、たしかに。MS-DOSになってからも /NOK のようにスラッシュでオプション指定していましたね。さすがお詳しい。
@takpon9261 Před 8 měsíci ⁺¹²
音質も画質も良くて助かる😊
@tosikisima163 Před 8 měsíci ⁺⁷
80年代には既に、バックスラッシュの文字コードの位置は各国の通貨記号を割り当ててよいことになっていることを知識として知っていました。
@joshyam4026 Před 8 měsíci ⁺¹⁴
ヒエログリフの上位互換！！
香港在住者ですが、公共の標識など漢字+英語の物を見掛ける度、「中国語の分からない非アジア圏出身の人には、半分の文字情報が全く無意味なのだなぁ」と感じて、日本語使用者の利点をしみじみ思います。
@user-sj8tj6kd6x Před 8 měsíci ⁺¹⁷
出演キャラが骨を虚空に書くと、視聴者側から見たら⻣に…
@user-tq8mn3uz2r Před 8 měsíci ⁺⁶
WindowsがUTF-8に対応して一番最初に感じたのは「スマホ用の絵文字(Emoji)が直接キーボード打つだけで使える！」って点でしたね。
それまではできなかったような気がします。
@maron1182 Před 8 měsíci ⁺⁵
だいぶ前ですが妖奇士(あやかしあやし)という漢字を武器にして戦うアニメがあった気がします！
@aa-uy3un Před 7 měsíci ⁺³
フォントの話をしている時に「ほんと」と言いまくってるの、堀元さんに怒られそうwwww
というか実際に紛らわしい笑
@Ippo-senkin Před 8 měsíci ⁺⁶
｢新たな刺客中華フォント化｣というテロップ自体が中華フォント化してるの芸が細かいですね
しかし統合漢字の影響がひらがなやカタカナにまで及んでる(ように見える)のはどういう理由なんだろう
@smnky Před 8 měsíci ⁺⁸
鋭いです！
多くの中華フォントは平仮名と片仮名を含んでいます。どちらも種類がすくないので、これを含めておくことにより中国人は自国のフォントのみで日本語コンテンツを表示できます（いわゆるトウフ■にならない）
ただしあちらのデザイナーが作っているので字面のバランスが（日本人には）気持ち悪く感じます。
よく通販などで買った海外製品の取説にある字体が不気味に感じるのはこのためです。
@user-jq2hc8fi4l Před 8 měsíci ⁺¹³
ßとβは手書きだと違いがわからない
@user-qt7hd1oo5k Před 8 měsíci ⁺³
わかりみが深すぎて、ほとんどのエピソードで己の若い頃の苦しい思い出が浮かび苦笑いしながら、先生の話をたのしませていただきました
@tika0314aoj Před 8 měsíci ⁺⁵
調べて解決するより聞いた方が早いってのはあるあるなんだけど、近くに証人がいるってのはすっげぇな
@atbashworld9456 Před 8 měsíci ⁺⁶
絵文字さんにもう足向けて寝れねえや
@takashikatou9676 Před 8 měsíci ⁺⁹
昔、友人がドイツ語のウムラウトをWebサイトに表示する方法が分からず、コロンを右につけて a: e: o: で表記していたのを思い出しました。「天才かよ!?」となりました。
@chumatsuz1758 Před 8 měsíci ⁺¹¹
ゆるコンピュータ科学ラジオ見てて「ツッコミたい！」って思ってたことがほぼ解説されててスッキリしました。私はDTPを仕事にしているので、誰か「ゆるDTP学ラジオ」もやらないかな、と期待してますｗ
@smnky Před 7 měsíci ⁺¹
ありがとうございます。
僕の説明にもいろいろなツッコミをいただいているので、まだ調べが甘い部分がありますね。
皆さんのコメントで足りない資料が補完されてきています。ありがたい。
DTP方面に詳しそうな学徒は誰だろう。くろうにさんとケイさんかな？
@mitsuwokusakabe Před 8 měsíci ⁺⁷
>漢字で戦うアニメ
『天保異聞妖奇士』　うっ、頭が……
@ofoneDyag Před 8 měsíci ⁺⁹
平田さんのエクセルにおける数字の話、てっきりシングルクォートつけると数値でなく文字列にできるって話かと思った。あのシングルクォートはある種のエスケープ記号と言えると思う。
@tksk Před 8 měsíci ⁺¹
エスケープ文字初めて知って(?)single quoteを持ち出したかと思って、平田さんむっちゃ賢くない？って思いましたね。
@vinataba0627 Před 8 měsíci ⁺⁴
ベトナム語では、電子文書の符号化方式はUTF-8、と、公式に決まっています。
@kentoo_1 Před 8 měsíci ⁺³
ドラム式洗濯機をベランダに入れられるかわざわざお店の人に来てもらったんですが、乾電池みたいに規格があればすごく楽になりますね
@smnky Před 7 měsíci ⁺²
ほんとですね。うちも洗濯機を買い替えるときは搬入がいつも不安です。
ちゃんと規格があれば、家などの搬入経路もそれが通るように設計しますしね。
@user-mj9gx1jg6s Před 8 měsíci ⁺⁵
軒先を借りて母屋を取ってしまいましたね。わかりやすく、面白かったです。
@aa-uy3un Před 7 měsíci ⁺²
一度普及すると置き換えられないの最たる例は周波数が東西日本で違う点でしょう
@smnky Před 7 měsíci ⁺¹
たしかに！
電気製品は両対応のものが普及しましたが、カメラのシャッタースピードでいつも悩まされてます。
@katsuito6084 Před 8 měsíci ⁺⁵
クリーンコンピュータMZ-80、懐かしいですね。
@user-ru2ep2mz1k Před 8 měsíci ⁺⁵
🍘も「夕日をバックにしたビル」に見えるって聞いた気がします
@smnky Před 8 měsíci ⁺¹
たしかに！エモい絵文字に見えてきました。
@joshyam4026 Před 8 měsíci ⁺⁶
ユニコードは、学術論文をパソコンで仕上げる現在、漢字だけでなく、楔形文字やヒエログリフ、話しにも出た線文字Bなど過去の遺物もコードを割り当てることになって、大変ですね。現行のタイ文字やミャンマー語文字など、縦方向に長くなる文字は、日本語や中国語などと混在すると行間がスカスカになるっていうのも、問題の一つかと思います。
@paragical Před 8 měsíci ⁺²
めっちゃ面白い
@tomonorikai7209 Před 8 měsíci ⁺⁸
44:10
「それこそフォントに～」
@user-kv9ek7dt6e Před 8 měsíci ⁺⁴
親のV740というラップトップでネットサーフィンしていた中学時代、4、5日に1件くらい文字化けしたサイトに出くわして文字コードいじってましたが高校に入る頃にはそんなサイトにはほとんど出くわさなくなり、ここ数年はブラウザの文字コード設定はいじったことありません。一般ユーザーが関知しない裏側で技術屋さんが頑張ってるんですね。
@早川眠人 Před 8 měsíci ⁺⁵
最初に遭遇した文字化けは第２水準漢字ROMの無いPCで表示したときの■トウフかな
@smnky Před 8 měsíci ⁺³
なつかしい。僕も X1/turbo でトウフに遭遇して第２水準漢字ROM導入ました。
@akaginao Před 8 měsíci ⁺³
さすが別館！面白かった。
@risingedgeprime1024 Před 5 měsíci ⁺³
9:06 エスケープ文字の説明が微妙ではと思いました。
「制御コードや特殊文字の直前に\を置くことによりその機能を無効化する」
特殊文字はその通りですが、制御コードはどちらかというと逆ですよね。
エスケープ文字機能は以下の2つに分かれると思います。
１．特別な意味を持った記号（特殊文字）をその文字自体として扱う＝「特別な意味」を無効化する
　→ダブルクォーテーションの例（\")
２．制御コードを表現するためにエスケープ文字＋制御文字で指定する
　→改行などの例（CR:
、LF:
など）
　　制御コードについては「無効化」という表現は誤解を招くかと思います。
@PRISMARK4 Před 8 měsíci ⁺⁴
漢字で戦うアニメ……アクエリオンロゴス？（アクエリオンシリーズは必殺技の演出が「THE 漢字」みたいな表現が多いですね）
@whzwiz Před 8 měsíci ⁺³
きっと話してくれると信じてました
@ksenda Před 8 měsíci ⁺⁶
このコンビええですわ。
二人の声の差が気持ちいい。
正規チャンネルでみたい！！
ほんで、スミノさんはゆるコンに学者枠で出てほしいっすわ。
あの子は専門知識と実績もあるねんやろけど
はしょる部分の解説がなんかアレなんで
スミノさんのサポートあったらもっとわかりやすいと思う。
@smnky Před 7 měsíci ⁺¹
ありがとうございます。IT分野はいまや裾野がかなり広いので、いろいろな分野や年代の人がいた方が知識や記憶を補完できるのは間違いないですね。機会があればぜひ。
@nanaki1006 Před 8 měsíci ⁺⁴
かつてのiモードには値段が定額じゃなくなる文字数を区別する機能がついてた気がします。
@kuma056 Před 8 měsíci ⁺¹⁰
32kBメモリが「海のように広い」と言われてた、そんな時代
@RR-yn5zz Před měsícem ⁺¹
車が１速からスタートしないとエンストするように、規格も１速で定義しないとそもそも普及しなかった、というより当時５速想定で定義したものは普及せず１速で定義したものに負けたという背景はありそう。
@user-dh8ci1zd9q Před 8 měsíci ⁺⁴
ファイアオントーフについては、現ドワンゴで当時iモードの絵文字を考えた栗田さんに話を聞きにいってもらいたいな〜
@newmarimo Před 8 měsíci ⁺³
WindowsNT3.1の時点で内部の文字コードはUnicode(UTF-16)だったような。
@smnky Před 7 měsíci
ご指摘ありがとうございます。たしかにNT系では早くからUnicodeだったようです。Win2000ではすでにUnicodeでした。
@masahase0117 Před 8 měsíci ⁺⁵
記号が足りないのでAPLでは専用の記号とキーボードを作りました。ただ、続く言語はありませんでしたね。
@inacpan6706 Před 8 měsíci ⁺⁴
アンペール社の WS-1 ですね。続く機械もありませんが、ワクワクした時代でした。
@smnky Před 7 měsíci ⁺²
懐かしい。 ⍟ とか ⍝ とか、APL以外では顔文字くらいでしか使われない記号ですね。
@kentoo_1 Před 8 měsíci ⁺⁴
φ（ギリシャ文字のファイ）と∅（空集合記号）は全く別の意味、は数学屋あるあるですね
@KIYO299 Před 8 měsíci ⁺⁵
VMWareのWebコンソール、デフォルトだとUSキーボード配列に強制的になるから、
"@"が入力できねぇ！":"はどこだ！？と、初めて触った時はすんごい混乱したなぁ…
@smnky Před 7 měsíci ⁺¹
フランスに行った別館館長のLE0さんは日々AZERTY配列で記号入力と格闘しているそうです笑
@keisukesugi5085 Před 8 měsíci ⁺⁴
骨の異体字に関しては、おめーらNとИ統一するぞと()
シンケンジャーはPower rangerでリメイクされてるはず…漢字どうなってるんだろう
@smnky Před 8 měsíci ⁺¹
Power Rangers Super Samurai のショドウフォンで書く字体はシンケンジャーのと一緒に見えました。
@popneo2007 Před 8 měsíci ⁺³
有名なツールも日本語使った途端にバグるのはよくありますね有名なeditorのvimもいつまでも日本語バグがあって日本人がパッチ上げていって直しました
@smnky Před 7 měsíci
ありますねー。Emacsでもバージョンアップ導入前に日本語入力が正しくできるかをまず確認していました。
@lib6809 Před 8 měsíci ⁺³
ちゃんとASCIIとISO646を分けて、ISO646のナショナルユースケースに触れている点が良いですね。¥問題をMSが悪いといいだす人たちに見て欲しい動画。でも、Windowsは初代NT(1993年)から現在(2023年)までシステムはUNICODEですよ。システムが非UNICODEだったのはMS-DOS系と非NT系です。
@smnky Před 7 měsíci ⁺¹
ご指摘ありがとうございます。僕のWindowsに関しての知識が甘かったです。仰るとおりWin2000ではすでにUnicodeだったのを思い出しました。
@HighCaloLily Před 8 měsíci ⁺⁸
中華フォントの違和感、仕事でMicr○soft Teamsを使っている人は頻繁に遭遇していますね
@pote26 Před 8 měsíci ⁺³
逆に普段使う文字を中華に合わせちゃえ! にはならんですかね? もんがまえの漢字とかがゲバ字で｢门｣、第一高校が㐧一高校とか、みたいなのは一定の世代には馴染み深いですし。0年代に日本生まれ日本育ちだけど簡単に書けて一定数に意味も通じるしそれでいいんじゃ、、、?とか思ったりします
何より欧米のゲーム会社が｢中国と日本は使う漢字違うんか、、、せや! 日本語ローカライズ見送ったろ!!｣とかなるよりはいいと思うんですよね、、、
@hondacreo3311 Před 8 měsíci ⁺¹⁴
Windowsの前の MS-DOS の前の CP/M-80の頃でも、パスの区切りは￥でしたね。確か、CP/M-80 がパス区切りにスラッシュを使えなかったのは、先にコマンドオプションをスラッシュにしてたからと聞いたことがあります。
ともあれ、今日もスミノ節全開で楽しませていただきました。準決勝は残念でしたけど、やっぱりいいですね！応援しています！！
@早川眠人 Před 8 měsíci ⁺⁶
CP/Mに階層ディレクトリは無いですよ。MS-DOSもversion1の頃は階層ディレクトリは無かった。
@hondacreo3311 Před 8 měsíci ⁺⁵
@@早川眠人！！！！そうでした！！！ってことは、オプションだけCP/Mから持ってきたMS-DOSが戦犯？
これ以上、墓穴を掘るのはやめましょう。訂正、ありがとうございました。感謝です！
@EanaHufwe Před 8 měsíci ⁺⁵
たしかオプションが/で使うプログラムとの互換性を保つため、パス区切りを似てるが使われてない\にするようにしたと聞いた覚えがある。
@ha9ha989 Před 8 měsíci ⁺³
VMS なんかは、DKA500:[000000.PROJECT.day.after.tomorrow]file.lic;21
というような問題の起こらないファイルパスだったのに、時代のいたずらですねぇ。
ファイルバージョンは今時の OS で復活してほしい。
@shomwoys Před 8 měsíci ⁺⁶
そもそも「文字」じたいに曖昧性があるので、実用と理想の合間で永遠に解決しないでしょう
「文字」は「形」と「意味」の対ですが、「意味」ば文脈で変わります
たとえば、「同じ形なら同じ数値（文字コード）でいいじゃん？」だったら、0Oや、Il1は同じコードでもよかったはずなんです
そうなってないのは少なからず形と意味は分けて考える必要がある
ならば意味にコードを振ろうか、となると、今度は「このコンテキストでは意味が同じで形が違う」
たとえば、高橋さんと髙橋さんは普通の検索では同一視したいけど表示は別にしたいとか
逆に「見た目が同じだけど意味が違う」というのも、実用上問題になることがあります
unicodeでいうところの「〜」はwavedashなのかfull width tildeなのか、とか
そもそも入力時にどっちなのかわからん、みたいな
まずコンピュータ関係なく、この漢字とこの漢字は公文書では統合しよう、みたいなことが国レベルで起こりますからねw
@smnky Před 7 měsíci
チルダの例で行くと、ネットショップで住所入力字のハイフンもなんとかしてほしいですね。厳密すぎてマイナス記号などを入れると「住所に使えない文字です」と弾かれることが多くて面倒です。
@joshyam4026 Před 8 měsíci ⁺⁸
￥　実際はCNY中國元/RMB人民幣の略称にも使われますよね？
@smnky Před 8 měsíci ⁺²
たしかに。そして「円」も「元」も「圓」が本来の表記でしたね。
@user-dc3yo4zr2k Před 8 měsíci ⁺³
スマホの普及で消えた(消えかけている)ものといえばコンデジ。
@Irix.5674 Před 8 měsíci ⁺⁴
作中で漢字が大きなテーマになっている作品としては
アホリズム (aphorism) がありますね。
この作品は一人 1 つの漢字に依存した異能力を使った
バトルマンガですね。
結構グロい内容が含まれています。
@user-gh9ms7qx1y Před 8 měsíci ⁺⁴
携帯電話の電話番号も090、080、070と来てるからそのうち0?0が足りなくなるんだろうなあ
@smnky Před 8 měsíci ⁺³
070は以前はPHSに割り当てられていた番号ですね。
現在の電話番号は11桁ですが、10桁の時代には050がPHSでした。
これから人口は極端には増えないと思いますが、IoTデバイスなどが増えてくると桁の拡張があるかもしれませんね。
@zaki50 Před 8 měsíci ⁺⁵
骨って書いてるキャラクター、キン骨マンですね
@smnky Před 8 měsíci ⁺²
キン骨マンを思い出して「弱そう…」発言してました笑
@yukikokay Před 8 měsíci ⁺³
最初から最後まで興味深い話で、面白かったです。
＞骨という字がついたキャラがいればいい
キン肉マンには、キン骨マンというキャラがいて、額に「骨」と書いてありましたね。
@smnky Před 8 měsíci ⁺²
キン骨マンをしっている方が多くて嬉しいですね。「弱そう」発言はキン骨マンがイメージにあったからなんです。そういえばボーンコールドっていう息子が出てましたね。あっちは強そう。
@tatsuwo-hazakura Před 8 měsíci ⁺³
♨️𓊝
島根県に「温泉津(ゆのつ)」という場所があり、最寄りの温泉津駅(山陰本線)には上記の絵文字表記(温泉♨️＋船𓊝)の駅名看板があったりしますw
@sozuinekomi9882 Před 8 měsíci ⁺³
Windowsのディレクトリ記号こそMS-DOSからのなごりなので、アホじゃなくて必然しかないな
Windowsをdosから起動したりdos窓開いたりしてたわけで
@taturou Před 8 měsíci ⁺⁶
おじさんとしては分かりみが深かったです。
Windows(の前のMS-DOS)でバックスラッシュをデリミタにしたのはビル・ゲイツがUNIXと同じじゃ嫌だと駄々を捏ねたから。という都市伝説を聞いたことがありますが、、、どちらにしろそういう時代でしたよね。汎用性より独自性を推してた。
@randmax3821 Před 8 měsíci ⁺⁷
当時MSはXenixってUNIX互換OS出してたぐらいなんでそれはないでしょうね。通説では階層ディレクトリが無かった1.0の頃に、コマンドラインオプションの指定にスラッシュを使っちゃってたから、と言われてます。今でも dir /w みたいに名残が残ってますね。
@inacpan6706 Před 7 měsíci ⁺²
@@randmax3821 「dir/w」は「dirのなかのw.exe」とは解釈されず、「dir△/w」と解釈されると。CP/M由来と聞いたことがあります。
@user-ej4br8gb5v Před 8 měsíci ⁺⁵
MS-DOS2.0でディレクトリ記号に\を
使い出したけど、それ以前のMS-DOSで
/をコマンドのオプションに使ってたからね。
昔のfortoranみたいにカラムで制御をして
行単位で命令を完結させれば記号の
問題はなかったけど、それはそれでめちゃ
不便だったw
@hiroya1192 Před 8 měsíci ⁺³
絵文字にそんな功績(CJK強制対応)があったとは。
@user-up9ig2to3y Před 8 měsíci ⁺⁴
中華フォント化の見出しも中華フォントになっている()
@tamarind_kingdom Před 8 měsíci ⁺²
mojo言語の拡張子が.🔥なのびっくりした
@smnky Před 7 měsíci ⁺²
なんと、.mojo 以外にも🔥が使えたんですね！こういう流れは歓迎したいです。
@lacolmena1973 Před 8 měsíci ⁺³
TeamsでWeb会議するときの参加者のアイコンが中華フォントになっていて気持ち悪いです。ですが、かなり多くの人に使われているはずなのにググってもそれを指摘している数は少ないです。私は学参フォントも気持ち悪く感じるのですが、字形にこだわるのは日本人でもここに来るような人ではない一般では少数派なのではと悲観しています。
@user-wb1fb1me6t Před 3 měsíci ⁺¹
Windowsのディレクトリ記号が￥マークなのは、
MS-DOSがそうだったからかと。
@molokheija Před 8 měsíci ⁺⁶
面白かった〜
漢字をひとまとめに中華フォント・字形にされる話、
AppleとかGoogleのサイトやメール表記がそれになるとフィッシングかな…？って疑心暗鬼に陥りそうなのでぜひ回避してほしいです😂
土鍋は滅びなくてよかった…
@smnky Před 7 měsíci ⁺¹
フィッシングに見えるのよくわかります。フォントがテキトーだと情報の信頼度が下がりますよね。
@早川眠人 Před 8 měsíci ⁺⁵
41:03 UNICODEでもIVS（異体字セレクタ）を使えば区別できる
@inacpan6706 Před 8 měsíci ⁺³
個人的には、IVSが規格化された目的は「こういう規格(アイディア)を用いないように」ということを啓蒙するためのものだと思っています。まるで辞書に「この文字は間違った文字、誤字」であることを掲載するために作られた文字、そんな風なものだと思っています。
@早川眠人 Před 8 měsíci ⁺²
@@inacpan6706
ユニコードの規格の理念から言って、文字デザインを規定するのはそれに反する。しかし、テキストファイルのみでの文字化けのない情報交換の必要性も理解できる。そのせめぎ合いの中で生まれたのがIVSだと思う。
@user-ty5hw3ej8v Před 8 měsíci ⁺⁵
こうやって誤りのようなものがあったら訂正していくのが良いですね（最近読んだ本が分かる発言）
@chigitakazuhiro7835 Před 2 měsíci ⁺¹
カタカナのソ、漢字の表などがShift-JISに5Cが含まれていてこれらの文字を使うと文字列が途中で切れる、誤動作するバグがよく出ていました。
@smnky Před 2 měsíci
PerlのCGIなどでも "表\示" のようにエスケープして回避していましたよね。懐かしい。
@user-kj7xo4ei1b Před 8 měsíci ⁺⁴
堀元見とビルゲイツをdisって来たな
@denpun1741 Před 2 měsíci ⁺²
骨がついてる主人公と言えば、呪術廻戦0の乙骨憂太がいますよね
@Gadona143 Před 8 měsíci ⁺⁵
47:31 ＞「骨」って書いてある主人公が現れればいい
キン肉マンのスピンオフ、キン骨マン待望論！
@smnky Před 8 měsíci ⁺¹
キン骨マンの息子のボーンコールドにでっかく「骨」って書いてあれば主役級でも行けそうな気がします。
@takedesu0 Před 8 měsíci ⁺⁴
MZ-80CはROM 16KB、RAM 48KBで26万8千円、MZ-80K はROM 16KB RAM 32KB 19万8千円だったと思う
@早川眠人 Před 8 měsíci ⁺⁴
ROMは4kiBですね。なにせクリーンコンピュータですから。
@takedesu0 Před 8 měsíci ⁺⁴
0000H- ROM
1000H- RAM
D000H- ビデオRAM
E000H?- メモリマップドI/O
だったかな？
記憶飛んでる😅
@smnky Před 7 měsíci ⁺¹
@@takedesu0
D000H = 53248 というのはいまだに覚えています。
画面の左上から直接Z80アセンブラに対応する文字を入力していって、D000H にコマンドでジャンブすると実行できたんですよね。
@kmr5947 Před 8 měsíci ⁺²
14:42 コンピュータ業界はアメリカ中心という話、画像処理系のプログラミングをやっていて、gray/greyのどっちがイギリス英語だっけといつも悩んでます。
あとプログラミングとは直接関係ないですが、装甲車の3DCGモデルを扱った時に自衛隊の車両だとアメリカ式のArmored Vehicleではなくイギリス式にArmoured Vehicleと綴られる事が多いらしくて、統一すべきか困った事があリます。
@vonneumann6161 Před 8 měsíci ⁺²
3:55 悪き A S C I I って聞こえた
@user-lz5ss3wo8p Před 8 měsíci ⁺³
「骨」の字がデザインされたキャラ……キン骨マン（「キン肉マン」）というのがいますが、ダメ……ですよねぇ。
@smnky Před 8 měsíci ⁺³
動画中に「なんか弱そう…」と言ったとき、キン骨マンをイメージしてました笑
@joshyam4026 Před 8 měsíci ⁺³
IBM-ATとか DOS/Vとかパソコン雑誌に現われる時代を知る自分は、この動画を見るまでマルチバイトという言い方を知りませんでした。頭の中は、英語byte=フランス語octetのレベルで止まっていました😅😅
@早川眠人 Před 8 měsíci ⁺⁵
マルチバイトとはASCIIとshift JISが混在する文字列を扱う場合に使う用語。全てUNICODEで文字列を扱う場合ワイドキャラクターと言う。
@matanki153cm Před 8 měsíci ⁺⁵
バックスラッシュと言えばAA・・・＼(^o^)／
CJK系のフォント、LaTeXでよくドン詰まってたの懐かしいな～。Unicodeありがと～～～💩
@smnky Před 7 měsíci
LaTeXでは ¥ がバックスラッシュとして機能したので、円マークを出したいときにはYと=を重ねたりした時期がありました。
@user-ht6rh7nu2y Před 8 měsíci ⁺⁵
47:13 キン骨マンがおるやろ!
@smnky Před 8 měsíci ⁺¹
懐かしいですね。「弱そう」発言は彼を思い出してなんですが、あれでも超人強度２０くらいはあった気がします。
@arcsin1203 Před 8 měsíci ⁺¹²
中国語勉強していると言編が画数少なくて楽なので自分用に見るメモにだけ真似してます
@smnky Před 8 měsíci ⁺³
同じく。言偏の簡略化（讠）がとくに便利です。
@socrateos Před 8 měsíci ⁺²
これ聞きながら、いまごろトロン・コードの必要性を感じてきた。坂村教授は正しかった？
@smnky Před 7 měsíci ⁺¹
懐かしいですね。僕も収録中何度かTRONという言葉が口から出そうになって「ここで話すと説明が長くなる・・・」と我慢してました。
@user-um6ur3py9d Před 3 měsíci ⁺²
なぜ元祖階層化ディレクトリの unix において '/' だったのを MS-DOS2.0 が '\' にしたのかが問題である ^^
@komthai8854 Před 8 měsíci ⁺¹²
ゆるコンピュータ科学ラジオは上っ面のキャッチーなネタを拾ってふざけ散らかしてるだけで、情報量に乏しい（ゆる学徒最底辺）のでこのようなツッコミは非常に良いと思います。
一方でこの動画にはエンタメ性、言い換えるとカタルシスがないんですよね😅
その辺りの脚本というか構成ができれば、「父殺し」も充分可能かと思いますけどねぇ🤣🤣
頑張って！
@user-op4ge9ny1z Před 8 měsíci ⁺³
同感です。とくに、右脳/左脳回はゆるコンピュータ科学ラジオのなかでもとくにひどかった。コンピュータは一般人にとって身近で深遠なジャンルであるからこそ、面白く解説できれば非常に価値がありますね。ぜひ父殺しをしてほしいです。
@smnky Před 7 měsíci ⁺¹
コメントありがとうございます。
おっしゃるとおり、自分で見返してもエンタメ性が乏しいと感じていたところです。
どのような構成が面白いのかも手探りで、みなさんのコメントを参考に調整していってます。
@nickfero Před 8 měsíci ⁺⁶
カーリーブラケットだよ
@smnky Před 8 měsíci ⁺⁷
ありがとうございます。編集時に「あー、しまった」と思ったのですが恥ずかしいので字幕ナシでスルーしようと…。やっぱり気づかれましたか笑
@早川眠人 Před 8 měsíci ⁺⁴
私はブレースと呼んでます
@-puddingalacremepatissiere8701 Před 8 měsíci ⁺⁵
繁体字、簡体字、新体字{旧当用漢字(現新体字)}、の問題ですね。
@masuo64 Před 8 měsíci ⁺⁴
いままで新字という言葉でしか見たことなかったんですが、新体字っていうんですね！
@inacpan6706 Před 8 měsíci ⁺⁴
@@masuo64 旧字体、新字体、拡張新字体。
@unknown00kuv Před 8 měsíci ⁺³
「中華フォント」については本当に、本当に、ほんっっっっっとうに深刻だと思ってる。
なぜならただ気持ち悪いじゃなく、文化の侵食につながる危険性があると思っているからです。
動画内の小学生の例である通り、中華フォントに触れるときってゲームやアニメなどのホビー、エンタメなんですよね。
だから意外と日常的な部分で触れる機会が多い。
更にスマホなどの日常化から中国製ソフトやハードの台頭などで、中華フォントを避けられない状況も増えてきている。
それで「気持ち悪い」と思っているうちはまだいいけど、何度も触れるうちに中華フォントに違和感を感じなくなったり、
「普及してきているから」と日本の制度のほうが中華フォントに対応するようなことになったら本当に取り返しがつかなくなる。
シングルバイト圏の人たちにはまじでこの問題に目を向けてほしいです。
@smnky Před 7 měsíci
おっしゃるとおりですね
だから日本アニメの放送を禁止する国があったり、中国ではGBコードで正しい文字が表示されることを義務づけていたりするんですよね。日本の官もこの辺にもっと関心を持ってほしいです。
@YasushiTakahashi007 Před 8 měsíci ⁺⁵
結局任意記号にファイルパスのセパレータを割り当てたマイクロソフトの悪行ってことだな。いやMSがパクったCPMのせい？
@smnky Před 8 měsíci ⁺³
CP/M由来説が濃厚そうですね。階層ディレクトリがなかったのでオプションに "/" を先に割り当てたと考えると辻褄があいます。
@user-kj7xo4ei1b Před 8 měsíci ⁺⁴
CJK統合漢字がある一方でハングルに12000もの無駄なコードが割り当てられている。
母音と子音個別のコードとそれを組み合わせたいわゆるハングル文字の両方があってハングルだけ使うことを考えても文書によって文字コードがぐちゃぐちゃになる。
漢字を捨てられるのならベトナムのようにローマ字表記にしておけばUS（ベトナムはフランス？）キーボードやアプリがそのまま使えて一番良かった。
漢字が必要な時は中国語を引用してくれば事足りる。
そして日本語と中国語の漢字に別々のコードを割り当てることができた。
@Zennin2007 Před 8 měsíci ⁺²
ハングルについては、Unicode 1.0時代にユニコードコンソーシアムがやらかしちゃった影響が大きいですね。それがなければ、Unicode 2.0で11172文字も登録することにならなかったか、登録するにしてもBMP外に登録したでしょう。
CJK統合漢字については、当初「世界中の全ての文字は16bitで表せられる」という妄想でUnicode 1.0を作っちゃったのが悪かったと思います。最初から、当初ISO/IEC 10646の案で設計されていた4オクテット固定長コード、あるいは可変長にしておけば、CJK統合漢字なんて発想もしなくて済んだはずです。
@早川眠人 Před 8 měsíci ⁺³
常用ハングル2600字で理論組合せ11000字だそうです。常用文字のみに個別コードを割り当て、その他は字母組合せ方式にすればコードポイントが大分節約できてたのにね。
@user-kj7xo4ei1b Před 8 měsíci ⁺²
@@早川眠人それをねじ込んだ理由が日中が大量の漢字を入れるならうちも同じ数のハングルをとゴネたためですからね。
おかげでMSは早々にサロゲートペアなるシフトJISの再発明をやらかすしUTF-8が標準になってやれやれですよ。
@user-qt7hd1oo5k Před 8 měsíci ⁺⁹
ちょっと女性の方のほうの知識の問題なのか話し方の問題なのか、男性のほうの折角の的を射た話の流れに、的はずれな話を持ち込まれると聞き手が混乱してしまいますね。できれば、こんな例示を合いの手として入れる、などとシナリオを作られたらとてもクオリティが上がると思いました。男性の方のお話はとてもクオリティが高いので。