AnyTech Engineer Blog

AnyTech Engineer Blogは、AnyTechのエンジニアたちによる調査や成果、Tipsなどを公開するブログです。

DeepLiquid Lite開発について ~カメラサーバ実装編~

関連する過去の記事 tech.anytech.co.jp AnyTechの赤川です。 AnyTechでは、「手軽に試せる流体解析AIパッケージ」としてDeepLiquid Lite(以下、Liteと記載)というものを提供しております。DeepLiquid Liteはブラウザベースで稼働するソフトウェアとなって…

JARVIS(っぽい何か)を作ろう!第五回:今までで作ったものを組み合わせる

はじめに 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズ第五回です。 前回までは、VRoidでキャラクターを作成してUnityで口パクできるプロジェクトを作成しました。今回は今まで作ったプログラムを編集し直してつなげ合わせ、使用者が声…

DeepLiquid Lite開発について ~バックエンド編~

AnyTechの赤川です。 AnyTechでは、「手軽に試せる流体解析AIパッケージ」としてDeepLiquid Lite(以下、Liteと記載)というものを提供しております。DeepLiquid Liteはブラウザベースで稼働するソフトウェアとなっており、その開発メンバーとして参画してい…

画像内の物体の数を数える手法の論文紹介: CACViT

皆さん、こんにちは。AnyTechの立浪と申します。先日、バンクーバーで開催されたAAAI-24に行ってまいりました。そこでみたポスターの中から気になった論文を一つご紹介したいと思います。[2305.04440] Vision Transformer Off-the-Shelf: A Surprising Basel…

簡単なデバイスドライバを作ってC++で呼び出す(1)

こんにちはAnyTechの岩井です。今回は簡単なデバイスドライバをC言語で作成し、それをC++で呼び出してみるところまでやってみようと思います。 背景 AIが製造現場で普及していく中で、AIを動かすオンプレサーバからアナログ/デジタル入出力を行って外部機器…

JARVIS(っぽい何か)を作ろう!第四回:キャラクターが喋っているような見た目を作る

はじめに 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズ第四回です。 前回までは、音声認識、text to text、音声合成を実装しました。 今回は上記の実装に加えて、合成音声で出力した音声に合わせてキャラクターが口パクし話しているよう…

DeepLiquid Lite開発について ~CI/CD編~

AnyTechの赤川です。 AnyTechでは、「手軽に試せる流体解析AIパッケージ」としてDeepLiquid Lite(以下、Liteと記載)というものを提供しております。DeepLiquid Liteはブラウザベースで稼働するソフトウェアとなっており、その開発メンバーとして参画してい…

ConvNets、スケーリング則成り立つってよ

皆さん、こんにちは。AnyTechの立浪と申します。 突然ですが、技術の進展は速いものですね。特に巨大テック企業は我々には使えないような莫大な計算リソースを使って、日々研究を進めています。羨ましい限りです。そんな莫大な研究リソースを手にしているGoo…

PatchCoreのバックボーンについて

こんにちは、AnyTechの嶋田と申します。 画像系の異常検知にはPatchCoreを使う機会が多いかと思いますが、PatchCoreのバックボーンは色々なモデルを使用することが可能です。 defaultではWideResNet50が使われていますが、他のバックボーンに変更した際の精…

Blenderでセマセグ用の教師データを作成

こんにちは、AnyTechの岩井です。 最近はBlender等の3DCGソフトや各社GPUの進歩により個人でも手軽に非常にリアルなCG画像を作れるようになりました。リアルなCGは映画やアニメなどの映像作品だけでなく、AIの教師データ作成にも使用されてきています。確か…

CLIPを使った画像に対する異常検知

皆さん、こんにちは。AnyTechの立浪と申します。 さて、皆さんは外観検査による異常検知には興味がおありでしょうか?最近いたるところで名前を聞く異常検知手法PatchCoreの影響か、2023年のCVPRでは異常検知手法の提案が急激に増えたように思います。PatchC…

JARVIS(っぽい何か)を作ろう!第三回:返答を合成音声で喋らせる

はじめに 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズ第三回です。 前回までは、耳となる音声認識、返答を返すtext to textを実装しました。 今回は口となる、合成音声という手法を使ってテキストを音声に変換し(.wavファイル)を生成…

エンジニア向け書籍紹介

こんにちは、AnyTechの赤川です。 今回は、私が最近読んだ本の中で特にエンジニアの方に読んでもらいたいと思った書籍について共有しようと思います。有名な本もあるのですでにお読みになられた方もいるかと思いますが、まだ手に取ったこともない方について…

DeepNetに99%癌ではないと判定されて安心できますか?

こんにちは!AnyTechの立浪と申します。この記事では、neural networkのcalibrationについての研究をご紹介したいと思います。地味なテーマですが注視すべき話題ですので、少しキャッチーなタイトルをつけさせて頂きました。 Calibrationとは? Confidence c…

JARVIS(っぽい何か)を作ろう!第二回:音声認識した結果から返答生成する

はじめに 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズ第二回です。 今回は、text to textという手法を用いて与えられた質問(テキスト)から返事(テキスト)を生成するプログラムを書きます。 前回:JARVIS(っぽい何か)を作ろう!第…

JARVIS(っぽい何か)を作ろう!第一回:マイクからリアルタイムで音声認識する

はじめに おはようございます!AnyTechの渡邉です。最近はAIとお話しすることにハマってます。 本記事はおしゃべりAIをオフラインかつローカルで実装するシリーズです。 JARVISって? 映画アイアンマンに登場する、主人公を日常・戦闘・開発のあらゆる状況で…

【Python高速化シリーズ】PyTorchとLibTorchを比較してみた②

こんにちは、AnyTechの赤川です。 前回の記事 tech.anytech.co.jp この記事では前回に引き続き、PyTorchとPyTorchのC/C++版であるLibTorchとの間で比較検証を行い、LibTorchの採用がもたらすモデルの推論速度の改善度合いについて、考察しました。前回は一か…

ImageNetモデルを用いた異常検知手法の解説【第5回:PatchCore(Towards Total Recall in Industrial Anomaly Detection)】

こんにちは、AnyTechの木村と申します。 AnyTechにて、機械学習エンジニアやAIエンジニアといった役割にて、R&Dに日々従事しております。 この記事は、昨今流行しているImageNetモデルを応用した異常検知手法について、リサーチをする機会がありましたので、…

ImageNetモデルを用いた異常検知手法の解説【第4回:PaDiM(a Patch Distribution Modeling Framework for Anomaly Detection and Localization)】

こんにちは、AnyTechの木村と申します。 AnyTechにて、機械学習エンジニアやAIエンジニアといった役割にて、R&Dに日々従事しております。 この記事は、昨今流行しているImageNetモデルを応用した異常検知手法について、リサーチをする機会がありましたので、…

ImageNetモデルを用いた異常検知手法の解説【第3回:SPADE(Sub-Image Anomaly Detection with Deep Pyramid Correspondences)】

こんにちは、AnyTechの木村と申します。 AnyTechにて、機械学習エンジニアやAIエンジニアといった役割にて、R&Dに日々従事しております。 この記事は、近年流行しているImageNetモデルを応用した異常検知手法について、リサーチをする機会がありましたので、…

ImageNetモデルを用いた異常検知手法の解説【第2回:DN2(Deep Nearest Neighbor Anomaly Detection)】

こんにちは、AnyTechの木村と申します。 AnyTechにて、機械学習エンジニアやAIエンジニアといった役割にて、R&Dに日々従事しております。 この記事は、近年流行しているImageNetモデルを応用した異常検知手法について、リサーチをする機会がありましたので、…

ImageNetモデルを用いた異常検知手法の解説【第1回:導入と転移学習】

こんにちは、AnyTechの木村と申します。 AnyTechにて、機械学習エンジニアやAIエンジニアといった役割にて、R&Dに日々従事しております。 この記事は、近年流行しているImageNetモデルを応用した異常検知手法について、リサーチをする機会がありましたので、…

NeurIPS 2022 参加報告

はじめに AntTechの立浪です。AnyTechでは深層学習とその周辺領域を担当してきます。 日が経ってしまいましたが、去年の12月に開催された機械学習分野の著名な国際会議 Neural Information Processing Systems (通称: NeurIPS) に参加してきました。開催場所…

matplotlibの高速化手法

こんにちは、AnyTechの岩井です。 今回は推論結果の可視化などで使うことが多いにも関わらず推論より遅いじゃないか!となることがあるmatplotlibでのplotを高速化する手法を備忘録もかねてここに紹介したいと思います。 実行環境 OS : Ubuntu20.04 CPU: Int…

流体&画像処理まとめ3選

はじめに こんにちは。 近年では物理シミュレーションの高速化、乱流などの非線形現象のモデル化、材料の特性等を研究するために、流体を始めとする物理現象を部分的に機械学習で置き換えるphysics inspiredやphysics informedな分野の研究が盛んになってき…

【Python高速化シリーズ】PyTorchとLibTorchを比較してみた①

こんにちは、AnyTechの赤川です。 この記事では、PyTorchとPyTorchのC/C++版であるLibTorchとの間で比較検証を行い、LibTorchの採用がもたらすモデルの推論速度の改善度合いについて、考察しました。 背景 PyTorchはPythonicな記述でモデル開発ができ、エコ…

LSTMがVision Transformerに戦いを挑んだら?

こんにちは、AnyTechの立浪です。 このたび、私の主著論文が「NeurIPS 2022」に採択されましたので、今回はこちらの論文について解説させていただきます。私が博士後期の学生として所属している立教大学と弊社でプレスリリースを出しております。立教大学の…