gpt-4-vision

There are 18 repositories under gpt-4-vision topic.

lobe-chat
lobehub / lobe-chat
🤯 Lobe Chat - an open-source, modern-design LLMs/AI chat framework. Supports Multi AI Providers( OpenAI / Claude 3 / Gemini / Ollama / Bedrock / Azure / Mistral / Perplexity ), Multi-Modals (Vision/TTS) and plugin system. One-click FREE deployment of your private ChatGPT chat application.
ai azure-openai chat chatglm chatgpt claude dalle-3 function-calling gemini gpt gpt-4 gpt-4-vision llama2 nextjs ollama openai tts
Language:TypeScript 31322
danny-avila / LibreChat
Enhanced ChatGPT Clone: Features OpenAI, Assistants API, Azure, Groq, GPT-4 Vision, Mistral, Bing, Anthropic, OpenRouter, Vertex AI, Gemini, AI model switching, message search, langchain, DALL-E-3, ChatGPT Plugins, OpenAI Functions, Secure Multi-User System, Presets, completely open-source for self-hosting. More features in development
ai bing chatgpt clone plugins search chatgpt-clone librechat langchain anthropic claude azure dall-e-3 gpt-4-vision openai vision google gemini webui assistant-api
Language:TypeScript 11798
roboflow / multimodal-maestro
Effective prompting for Large Multimodal Models like GPT-4 Vision, LLaVA or CogVLM. 🔥
lmm multimodality segment-anything instance-segmentation object-detection gpt-4 gpt-4-vision llava prompt-engineering visual-prompting cross-modal vision-language-model
Language:Python 960
Skythinker616 / gpt-assistant-android
免费的ChatGPT API的安卓语音助手，可用音量键唤起并进行语音交流，支持联网、Vision拍照识图、提问模板等功能 | A free ChatGPT API voice assistant for Android, activated via volume keys for voice interaction, supporting features such as network connectivity, Vision photo recognition, and question templates.
android assistant chatgpt free-gpt gpt-4-vision markdown
Language:Java 532
SkalskiP / sports
Cool experiments at the intersection of Computer Vision and Sports ⚽🏃
computer-vision deep-learning deep-neural-networks object-detection pytorch sports-analytics tutorial yolov5 yolov7 gpt-4 gpt-4-vision prompt-engineering
Language:Jupyter Notebook 443
lancedb / vectordb-recipes
High quality resources & applications for LLMs, multi-modal models and VectorDBs
agents ai deep-learning embeddings fine-tuning gpt gpt-4-vision langchain llama-index llms machine-learning multimodal openai rag vector-database
Language:Jupyter Notebook 427
szczyglis-dev / py-gpt
Desktop AI Assistant powered by GPT-4, GPT-4 Vision, GPT-3.5, DALL-E 3, Langchain, Llama-index, chat, vision, voice control, image generation and analysis, autonomous agents, code and command execution, file upload and download, speech synthesis and recognition, access to Web, memory, prompt presets, plugins, assistants & more. Linux, Windows, Mac.
api artificial-intelligence chatbot completion desktop-app gpt-35-turbo gpt3-turbo gpt4 gpt4-api image-generation openai ai dalle-3 gpt-4-vision langchain ai-assistant llm autonomous-agent llama-index gpt-4
Language:Python 339
vdutts7 / gpt4V-scraper
AI agent that can SEE 👁️, control, navigate, & do stuff for you on your browser.
ai-agents browser-automation gpt-4-vision puppeteer web-scraping
Language:JavaScript 223
TypingMind / typingmind
The most advanced Web UI for AI chat
chatgpt chatgpt-ui claude claude2 gemini gemini-pro gpt-4 gpt-4-turbo gpt-4-vision typingmind webui
Language:HTML 197
tbckr / sgpt
SGPT is a command-line tool that provides a convenient way to interact with OpenAI models, enabling users to run queries, generate shell commands and produce code directly from the terminal.
cli bash gpt-3 gpt-4 openai shell go gpt-4-vision gpt-4-vision-preview gpt-4o
Language:Go 178
WisconsinAIVision / ViP-LLaVA
[CVPR2024] ViP-LLaVA: Making Large Multimodal Models Understand Arbitrary Visual Prompts
chatbot clip cvpr2024 foundation-models gpt-4 gpt-4-vision llama llama2 llava multi-modal vision-language visual-prompting
Language:Python 169
davidmigloz / pixels2flutter
Convert a screenshot to a working Flutter app.
flutter gpt-4-vision llms openai
Language:Dart 134
developersdigest / ai-devices
AI Device Template Featuring Whisper, TTS, Groq, Llama3, OpenAI and more
groq gpt-4-vision llama3 llm openai tts whisper function-calling langchain langsmith llava serper
Language:TypeScript 117
sazonovanton / SirChatalot
SirChatalot is a Telegram bot leveraging ChatGPT, Claude or YandexGPT. It uses Whisper for speech-to-text and DALL-E, Stability AI or YandexART for image creation. It can use vision capabilities or tools/functions.
chatgpt telegram-bot whisper openai openai-api yandexgpt yandex-gpt dall-e anthropic claude claude-api function-calling stability-ai web-search tool-use yandexart gpt-4-vision python-telegram-bot gpt-4o
Language:Python 61
nateraw / openai-vision-api-for-videos
Extract information, summarize, ask questions, and search videos using OpenAI's Vision API 🚀🎦
chatgpt colab-notebook gpt-4 machine-learning openai python gpt-4-vision
Language:Jupyter Notebook 57
Anil-matcha / GPT-4-Vision-Chatbot
GPT-4 Vision Chatbot examples
gpt-4 gpt-4-turbo gpt-4-vision-preview gpt-4-vision
Language:Jupyter Notebook 55
ktutak1337 / Stellar-Chat
A multi-modal chat application enabling users to create custom agents, and integrate with local LLMs (Local Language Models), as well as OpenAI models.
agents ai blazor chat chatpgt csharp dalle-3 dotnet gpt gpt-4-vision llm llma2 ollama openai stable-diffusion
Language:C# 55
signebedi / gptty
ChatGPT wrapper in your TTY
chatbot openai gpt-3 openai-api gpt-4 chatroom click gpt-35-turbo query shell tty chatgpt chatgpt-api package python gpt-4-turbo gpt-4-vision
Language:Python 47
shellChatGPT
mountaineerbr / shellChatGPT
Shell wrapper for OpenAI's ChatGPT, DALL-E, Whisper, and TTS. Features LocalAI, Ollama, Gemini, and Mistral integration.
awesome-chatgpt-prompts awesome-chatgpt-prompts-zh bash chatbot davinci terminal chat-completions text-completions gpt-4-vision tts localai ollama gemini-api gemini-pro mistral-api gpt-4o
Language:Shell 38
GianfrancoCorrea / gpt-4-vision-chat
GPT 4 Turbo Vision with Chainlit
chainlit gpt-4 gpt-4-turbo gpt-4-vision
Language:Python 32
supershaneski / chatgpt-with-image-sample
This sample project integrates OpenAI's GPT-4 Vision, with advanced image recognition capabilities, and DALL·E 3, the state-of-the-art image generation model, with the Chat completions API. This powerful combination allows for simultaneous image creation and analysis.
chatbot chatgpt function-calling nextjs openai openai-api openai-chatgpt reactjs chatgpt-image dall-e-3 gpt-4-vision gpt-4-vision-preview image-analysis
Language:JavaScript 19
Helltar / artific_intellig_bot
AI Telegram Bot, ChatGPT, Dalle2, Whisper, GPT-4 Vision, Stability AI
ai-bot chatgpt dalle2 openai stable-diffusion telegram-bot chatgpt-bot whisper whisper-api chatgpt-kotlin kotlin-telegram gpt-3-5-turbo gpt-4 gpt-4-vision
Language:Kotlin 18
LazaUK / AOAI-GPT4Vision-Streamlit-SDKv1
Using Azure OpenAI deployment of GPT-4 Turbo with Vision to analyse out-of-stock situation in a fictitious retail shop.
ai azure gpt gpt-4-vision openai out-of-stock streamlit
Language:Python 18
42lux / CaptainCaption
A gradio based image captioning tool that uses the GPT-4-Vision API to generate detailed descriptions of images.
captioning gpt-4-vision gradio openai-api tagging
Language:Python 15
neka-nat / mylangrobot
Language instructions to mycobot using GPT-4V
chatgpt gpt4v mycobot segment-anything whisper gpt-4-vision gpt-4-vision-preview
Language:Python 15
waseemhnyc / object-detection-openai
Object detection using Open AI Vision Model
ai gpt-4-vision gpt-4-vision-preview openai python
Language:Python 15
komzweb / nextjs-gpt4v
A simple chat app with vision using Next.js, Vercel AI SDK, and GPT-4V.
gpt-4-vision nextjs react tailwindcss typescript vercel-ai-sdk
Language:TypeScript 12
kornia / pixie
Pixie: Computer Vision AI Engineer assistant
artificial-intelligence chatgpt computer-vision deep-learning geometry gpt-4-vision machine-learning robotics
12
mickymultani / GPT-4-Vision-Architecture-Scanner
A web-based tool that utilizes GPT-4's vision capabilities to analyze and describe system architecture diagrams, providing instant insights and detailed breakdowns in an interactive chat interface.
architecture-visualization computer-vision flask flask-api flask-application gpt-4 gpt-4-turbo gpt-4-vision gpt-4-vision-preview gpt-vision llm llms openai openai-chatgpt openapi
Language:JavaScript 12
scalable-dynamics / gpt-spa
A customizable GPT in a single page, using OpenAI models text-embedding-ada-002, tts-1, whisper-1, dall-e-3, and gpt-4-vision-preview
dalle-e gpt-4 gpt-4-vision openai
Language:JavaScript 12
mapluisch / GPT-4-Vision-for-HoloLens
Capture images with HoloLens and receive descriptive responses from OpenAI's GPT-4V(ision).
gpt-4 gpt-4-vision-preview hololens hololens2 openai openai-api unity3d gpt-4-vision gpt4vision hololens-applications
Language:ShaderLab 10
reidbarber / gen-ui
Use text or image prompts to generate components and apps built with React.
assistants-api gpt-4-vision openai react sandpack codesandbox gpt-4
Language:TypeScript 10
jacobmarks / gpt4-vision-plugin
Chat with your images using GPT-4 Vision!
data-centric-ai fiftyone gpt-4 gpt-4-vision multimodal openai openai-api plugin python
Language:Python 9
172478394 / chatkore
chatkore为开发者提供优质稳定的OpenAI相关的API调用接口，方便国内用户使用各类开源ChatGPT项目或者AI领域的库的使用。
chatbot chatgpt gpt-35-turbo gpt-4 openai openai-api chatgpt-web autogpt agentgpt embeddings dall-e dall-e-3 gpt-4-vision tts whisper
8
wfce / ChatGPT-OpenAI-API
全网最低价的OpenAI ChatGPT-4-32K、ChatGPT-3.5 API 最高低于官方价42倍。The lowest-priced OpenAI ChatGPT-4-32K and ChatGPT-3.5 APIs on the entire network are 42 times lower than the official price.
chatgpt gpt-35-turbo gpt-4 gpt-4-vision gpt-4-vision-preview gpt4all openai openai-api
8
jeremy-collins / gpt4v-screenshot-analyzer
Using OpenAI's GPT-4 Vision API, this tool offers an interactive way to analyze and understand your screenshots. Capture any part of your screen and engage in a dialogue with ChatGPT to uncover detailed insights, ask follow-up questions, and explore visual data in a user-friendly format.
ai chatbot chatgpt computer-vision gpt-4 gpt-4-vision screenshot
Language:Python 7

gpt-4-vision

lobehub / lobe-chat

danny-avila / LibreChat

roboflow / multimodal-maestro

Skythinker616 / gpt-assistant-android

SkalskiP / sports

lancedb / vectordb-recipes

szczyglis-dev / py-gpt

vdutts7 / gpt4V-scraper

TypingMind / typingmind

tbckr / sgpt

WisconsinAIVision / ViP-LLaVA

davidmigloz / pixels2flutter

developersdigest / ai-devices

sazonovanton / SirChatalot

nateraw / openai-vision-api-for-videos

Anil-matcha / GPT-4-Vision-Chatbot

ktutak1337 / Stellar-Chat

signebedi / gptty

mountaineerbr / shellChatGPT

GianfrancoCorrea / gpt-4-vision-chat

supershaneski / chatgpt-with-image-sample

Helltar / artific_intellig_bot

LazaUK / AOAI-GPT4Vision-Streamlit-SDKv1

42lux / CaptainCaption

neka-nat / mylangrobot

waseemhnyc / object-detection-openai

komzweb / nextjs-gpt4v

kornia / pixie

mickymultani / GPT-4-Vision-Architecture-Scanner

scalable-dynamics / gpt-spa

mapluisch / GPT-4-Vision-for-HoloLens

reidbarber / gen-ui

jacobmarks / gpt4-vision-plugin

172478394 / chatkore

wfce / ChatGPT-OpenAI-API

jeremy-collins / gpt4v-screenshot-analyzer