️ وقتی هوش مصنوعی گزارشگر فوتبال میشود
این ویدئو با استفاده از مدل هوش مصنوعی «GPT-4 with Vision» یا «GPT-4V» به همراه فناوری تبدیل متن به گفتار (TTS) ساخته شده است.
برای انجام این گزارشگری، هر فریم ویدئو از طریق API به مدل GPT-4 Vision داده شده تا اون رو توصیف کنه.
در قدم بعدی متن خروجی GPT-4 به مدل تبدیل متن به صدای OpenAI داده شده تا این متن رو با صدای طبیعی به صدای گزارشگر تبدیل کنه.
طبق ادعای سازنده، تک تک فریمهای ویدئو به GPT-4V داده شده و از پرامپتهای سادهای برای ساخت نریشن استفاده شده
کيونما