AnyTech Engineer Blog

AnyTech Engineer Blogは、AnyTechのエンジニアたちによる調査や成果、Tipsなどを公開するブログです。

CLIPを使った画像に対する異常検知

皆さん、こんにちは。AnyTechの立浪と申します。 さて、皆さんは外観検査による異常検知には興味がおありでしょうか?最近いたるところで名前を聞く異常検知手法PatchCoreの影響か、2023年のCVPRでは異常検知手法の提案が急激に増えたように思います。PatchC…

JARVIS(っぽい何か)を作ろう!第三回:返答を合成音声で喋らせる

はじめに 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズ第三回です。 前回までは、耳となる音声認識、返答を返すtext to textを実装しました。 今回は口となる、合成音声という手法を使ってテキストを音声に変換し(.wavファイル)を生成…

エンジニア向け書籍紹介

こんにちは、AnyTechの赤川です。 今回は、私が最近読んだ本の中で特にエンジニアの方に読んでもらいたいと思った書籍について共有しようと思います。有名な本もあるのですでにお読みになられた方もいるかと思いますが、まだ手に取ったこともない方について…

DeepNetに99%癌ではないと判定されて安心できますか?

こんにちは!AnyTechの立浪と申します。この記事では、neural networkのcalibrationについての研究をご紹介したいと思います。地味なテーマですが注視すべき話題ですので、少しキャッチーなタイトルをつけさせて頂きました。 Calibrationとは? Confidence c…

JARVIS(っぽい何か)を作ろう!第二回:音声認識した結果から返答生成する

はじめに 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズ第二回です。 今回は、text to textという手法を用いて与えられた質問(テキスト)から返事(テキスト)を生成するプログラムを書きます。 前回:JARVIS(っぽい何か)を作ろう!第…

JARVIS(っぽい何か)を作ろう!第一回:マイクからリアルタイムで音声認識する

はじめに おはようございます!AnyTechの渡邉です。最近はAIとお話しすることにハマってます。 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズです。 JARVISって? 映画アイアンマンに登場する、主人公を日常・戦闘・開発のあらゆる状況で…

【Python高速化シリーズ】PyTorchとLibTorchを比較してみた②

こんにちは、AnyTechの赤川です。 前回の記事 tech.anytech.co.jp この記事では前回に引き続き、PyTorchとPyTorchのC/C++版であるLibTorchとの間で比較検証を行い、LibTorchの採用がもたらすモデルの推論速度の改善度合いについて、考察しました。前回は一か…