2024年05月25日(土)
任意の画像をアップロードするだけで Geminiによる画像解析が可能なオープンソースのWebアプリ・「VisionGPT」
VisionGPT
VisionGPTは任意の画像をアップロードするだけで Geminiによる画像解析が可能なオープンソースのWebアプリです。アプリの名前と使用モデルが合っていませんが、GPT=AI的なものという強いイメージが世間に付いている印象ですし、その辺を利用したいのかもしれませんがOpenAIのGPTモデルは使われていません。単純に画像をアップロードすると即解析し、結果をテキストで提示してくれる、というもの。AIモデルにGemini Pro Visionが使われています。動作確認出来る公開済みのWebアプリ及びリポジトリのソースコードでは仕様上、一定のクレジットをユーザー毎に付与し、亡くなり次第課金を促すようになっていますが、ローカル等で動かす際はAPI周りに加えてこの辺のコードを変更する必要がありま...
author:
かちびと.net
WordPressやJQueryなどを中心に、Web開発者のためのチュートリアルやコードスニペットの記事を公開しているTakahashi Yoheiさんのブログ
関連記事
Ads
WordPressやJQueryなどを中心に、Web開発者のためのチュートリアルやコードスニペットの記事を公開しているTakahashi Yoheiさんのブログかちびと.netの記事『任意の画像をアップロードするだけで Geminiによる画像解析が可能なオープンソースのWebアプリ・「VisionGPT」』についてまとめています。
この記事は特に写真・サーバ・アプリについて書かれており、 気になるWebデザインの記事やまとめを見つけたら「本文を読む」をクリックすると、記事配信元のかちびと.netで全文を閲覧することができます。RSS Sourceの「このサイトの記事一覧」をクリックするとかちびと.netの記事をまとめて表示することができます。また閲覧数や各SNSのシェア状況を目安に、他の人たちが記事をどのように評価しているのか推測することができます。Webデザインにとって有益な記事をまとめていますので、ぜひリンク先をチェックしてみてください。