تماشای ویدئو گزارش فوتبال هوش مصنوعی از کيونما

️ وقتی هوش مصنوعی گزارشگر فوتبال می‌شود این ویدئو با استفاده از مدل هوش مصنوعی «GPT-4 with Vision» یا «GPT-4V» به همراه فناوری تبدیل متن به گفتار (TTS) ساخته شده است. برای انجام این گزارشگری، هر فریم ویدئو از طریق API به مدل GPT-4 Vision داده شده تا اون رو توصیف کنه. در قدم بعدی متن خروجی GPT-4 به مدل تبدیل متن به صدای OpenAI داده شده تا این متن رو با صدای طبیعی به صدای گزارشگر تبدیل کنه. طبق ادعای سازنده، تک تک فریم‌های ویدئو به GPT-4V داده شده و از پرامپت‌های ساده‌ای برای ساخت نریشن استفاده شده
29 آبان 1402
کيونما
loading...