2025年3月25日火曜日

RM Noise


最近Galaxyの携帯のCMで風のノイズ除去をしているシーンが気になっていて、「AIで処理すれば、ノイズ除去性能は上がるのでは?」なんて思いながら、 AIのopen source?のHagging faceをブラブラしていましたら、何故かFacebookでRM noizeなる投稿が出てきました。 FaceBookの投稿は国内の方だったように思いますが、見つけられないので省略。 RMnoiseでググって他のJAの記述を見つけましたのでそのリンク

で、とにかくインストール。CW/SSBで勉強させている!ということなので、手元のFlex 6600で、試してみました。 入力をDAXにして出力をMicrosoftサウンドマッパー・Outputとして、SSBの信号を聞いてみると効果は絶大! 

FT8でこれが使えないか?とちょっと思って、RM noiseのcommunityを見てみると、同じことを考える人はいるようで、実験もしていて、結果ダメ! 流石に数Hzの帯域幅で処理しているFT8では無理のようです。 

ま、SSBとCWでこれ程の効果があれば、少なくとも耳の健康には寄与するし、精神的にも楽になります。

問題はLatencyがあるので、onにしてtuningはし難いので、offにしてtuningした後でonにする必要がありそうです。

 

 

2025年3月22日土曜日

AI環境をWin11に構築してみる

普段使用しているPC(CoreUltra7 265k 64GB, GeForce RTX4070TiS)にインターフェース2025 3「仕事のための生成AI」を見ながらAI環境を構築してみました。


 SSDを追加して、だいぶ容量が大きくなっていますが、最近追加した部分が増設したところに保存されているのか、ちょっと自信がありません。

 

 

 1)LLM ローカルLLM開発環境

  ollamaDocker Desktopをインストール 

 


特に問題なくインストールでき、動作もしているようなのですが、使い方がよくわからないので、ボチボチ勉強してゆくつもり。

最近、疑問に思っているのは「何故、LLMで文章のサマリーが作れるんだろうか」ということ。 文章全体の意味を理解できるロジックが内蔵されているとは思えない。LLMってパターンマッチング、と品詞などの統計的な処理などの、細かい部分についての処理をしている事は理解できますが、それが文章全体の大意にどうして結びつくのか??、というか、人間が文章の要旨を作るという活動は何をしているんだろうか? という方向に頭が向いてわからなくなってしまった。

2)異常画像を作るレッスン

 CUDAとcuDNNのインストールはNvidiaのページからダウンロードしてきて、問題なく終了?(Visual Studio Codeがインストールされていない状態で、CUDAインストールすると、うまくゆかないので、順番を間違えないこと。 最初これで引っかかった)

cuDNNのインストール後にzlibのdllが必要で、これをgithubからソースをダウンロードしてきて、cmakeでコンパイルするところで、躓きました。 こことか、ここにやり方が書いてあって、実行してみるとcmakeがうまく動いてくれませんでした。 最終的にここに出ていた、"x64 Native Tools Command Prompt for VS 2022を起動し、zlibをcloneしたフォルダに移動します。"で無事インストール出来ました。 (cmakeのインストールとかも、結構てこずってしまいました)。

 こちらの方は、動作確認ができていないので、これから少しづつIFのサンプルコードを動かして確認してゆく予定。

しかし、これもStable Diffusionモデルで、なんで画像が作れるのか?がよくわかりません。人間様も同じような、ノイズの山から、古い記憶で少しづつ画像を組み上げてゆく、なんてことをしているんだろうか?

最近は、すぐに分からない事にぶつかってしまい、なかなか理解が進みません。

 

 

2025年3月10日月曜日

久しぶりのemacs

 大昔、Unixに魅了され、でもUnixは入手できない時代('82~'86)のOS9にGNUの諸々を移植する活動が行われていて、その時代に移植されたemacsを使い始め、その後のFreeBSD/Linuxの時代('92~)にもemacsを使っていましたが、Win10/Win11ベースに無線をするようになって、とんとご無沙汰していたEmacs.  

 先日本屋で立ち読みしていたSoftwareDesignの記事に刺激されて、Win11にEmacs 30.1をインストールしてみました。 特にpythonを書くとか(これはanacondaでOK)、特別の理由があったわけではありませんが、OpenAI等とのインターフェースってどうなっているのか、ちょっと知りたかったので。

 インストールしてみると、すっかり忘れている。 それと手元のemacs本は古くて?あまり参考にならない。 しようがないのでEmacs実践入門「改定新版」(技術評論社)を中古で買って、頭から追っかけてみました。 どうもうまくゆかないのがlispのpackageに関わるところで、list-packageで拾ってこれる奴は簡単にインストールできるのですが、M-x package-installでインストールしろ、とあるelscreenとかmoccur-editが「見つからない!」と返ってきてうまくゆかなくて、頓挫。

 ま、使い勝手だけでも、とキーマップを変更しよう(Capslock->ctrl-left, ctrl-left -


>capslock) とMSのpower toysの「キーの再マップ」を弄ってみると、今度はキー入力ができなかったり、emacs でC-fとした後にファイル名の入力をしようとするとC-~がすでに入っていたり、かな漢字変換キーがどこかへ行ったりと、これまた滅茶苦茶。 キーボードはlogi coolのK295ですが、当面は左下端のctrl-leftに左小指をのっけて、左手股裂き状態を甘受するしかないみたい。 caps lockと英数が同じキーにアサインされている所為なんでしょうが、だれか解決方法を知らないだろうか?ググっても出てこない。

 

RM Noise

最近Galaxyの携帯のCMで風のノイズ除去をしているシーンが気になっていて、「AIで処理すれば、ノイズ除去性能は上がるのでは?」なんて思いながら、 AIのopen source?の Hagging face をブラブラしていましたら、何故かFacebookで RM noize ...