All Gemini 1.0 and Gemini 1.5 models are now retired.
To avoid service disruption, update to a newer model (for example, gemini-2.5-flash-lite). Learn more.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

فایل های صوتی را با استفاده از API جمینی تجزیه و تحلیل کنید

شما می‌توانید از یک مدل Gemini بخواهید فایل‌های صوتی که شما ارائه می‌دهید را چه به صورت درون‌خطی (با کدگذاری base64) و چه از طریق URL تجزیه و تحلیل کند. وقتی از Firebase AI Logic استفاده می‌کنید، می‌توانید این درخواست را مستقیماً از برنامه خود انجام دهید.

با این قابلیت، می‌توانید کارهایی مانند موارد زیر را انجام دهید:

توصیف، خلاصه کردن یا پاسخ به سوالات مربوط به محتوای صوتی
رونویسی محتوای صوتی
بخش‌های خاصی از صدا را با استفاده از مهرهای زمانی تجزیه و تحلیل کنید

پرش به نمونه‌های کد پرش به کد برای پاسخ‌های استریم‌شده

برای گزینه‌های بیشتر برای کار با صدا، به راهنماهای دیگر مراجعه کنید.
تولید خروجی ساختاریافته ، چت چند نوبتی ، استریمینگ دوطرفه

قبل از اینکه شروع کنی

برای مشاهده محتوا و کد مخصوص ارائه‌دهنده در این صفحه، روی ارائه‌دهنده API Gemini خود کلیک کنید.

اگر هنوز این کار را نکرده‌اید، راهنمای شروع به کار را تکمیل کنید، که نحوه راه‌اندازی پروژه Firebase، اتصال برنامه به Firebase، افزودن SDK، راه‌اندازی سرویس backend برای ارائه‌دهنده API انتخابی Gemini و ایجاد یک نمونه GenerativeModel را شرح می‌دهد.

برای آزمایش و تکرار روی درخواست‌هایتان، توصیه می‌کنیم از Google AI Studio استفاده کنید.

به نمونه فایل صوتی نیاز دارید؟

شما می‌توانید از این فایل عمومی با نوع MIME audio/mp3 ( مشاهده یا دانلود فایل ) استفاده کنید. https://storage.googleapis.com/cloud-samples-data/generative-ai/audio/pixel.mp3

تولید متن از فایل‌های صوتی (با کدگذاری base64)

قبل از امتحان کردن این نمونه، بخش «قبل از شروع» این راهنما را برای راه‌اندازی پروژه و برنامه خود تکمیل کنید.
در آن بخش، شما همچنین می‌توانید روی دکمه‌ای برای ارائه‌دهنده‌ی API Gemini انتخابی خود کلیک کنید تا محتوای خاص ارائه‌دهنده را در این صفحه مشاهده کنید .

شما می‌توانید از یک مدل Gemini بخواهید با ارائه متن و صدا، متن تولید کند - و mimeType فایل ورودی و خود فایل را ارائه دهد. الزامات و توصیه‌هایی برای فایل‌های ورودی را بعداً در این صفحه بیابید.

سویفت