AnyTech Engineer Blog

AnyTech Engineer Blogは、AnyTechのエンジニアたちによる調査や成果、Tipsなどを公開するブログです。

Blenderでセマセグ用の教師データを作成

こんにちは、AnyTechの岩井です。 最近はBlender等の3DCGソフトや各社GPUの進歩により個人でも手軽に非常にリアルなCG画像を作れるようになりました。リアルなCGは映画やアニメなどの映像作品だけでなく、AIの教師データ作成にも使用されてきています。確か…

CLIPを使った画像に対する異常検知

皆さん、こんにちは。AnyTechの立浪と申します。 さて、皆さんは外観検査による異常検知には興味がおありでしょうか?最近いたるところで名前を聞く異常検知手法PatchCoreの影響か、2023年のCVPRでは異常検知手法の提案が急激に増えたように思います。PatchC…

JARVIS(っぽい何か)を作ろう!第三回:返答を合成音声で喋らせる

はじめに 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズ第三回です。 前回までは、耳となる音声認識、返答を返すtext to textを実装しました。 今回は口となる、合成音声という手法を使ってテキストを音声に変換し(.wavファイル)を生成…

エンジニア向け書籍紹介

こんにちは、AnyTechの赤川です。 今回は、私が最近読んだ本の中で特にエンジニアの方に読んでもらいたいと思った書籍について共有しようと思います。有名な本もあるのですでにお読みになられた方もいるかと思いますが、まだ手に取ったこともない方について…

DeepNetに99%癌ではないと判定されて安心できますか?

こんにちは!AnyTechの立浪と申します。この記事では、neural networkのcalibrationについての研究をご紹介したいと思います。地味なテーマですが注視すべき話題ですので、少しキャッチーなタイトルをつけさせて頂きました。 Calibrationとは? Confidence c…

JARVIS(っぽい何か)を作ろう!第二回:音声認識した結果から返答生成する

はじめに 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズ第二回です。 今回は、text to textという手法を用いて与えられた質問(テキスト)から返事(テキスト)を生成するプログラムを書きます。 前回:JARVIS(っぽい何か)を作ろう!第…

JARVIS(っぽい何か)を作ろう!第一回:マイクからリアルタイムで音声認識する

はじめに おはようございます!AnyTechの渡邉です。最近はAIとお話しすることにハマってます。 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズです。 JARVISって? 映画アイアンマンに登場する、主人公を日常・戦闘・開発のあらゆる状況で…