画像認識(Lm Studio)

画像(イメージ)から文字を作成できるモデルがありますが、これがなかなか面白い反応を示してくれます。

日本語も理解しつつ、画像認識でき、安定運用できるモデルが Google の gemma です。

Lm Studio でのチャットが楽しいです。

2枚目の写真は「柴犬」です。

コメント