یک ابزار ساده، رایگان و متن-باز تحت وب برای تبدیل متن به گفتار (TTS) با استفاده از Google's Gemini API.
این ابزار به طور خاص برای تولید فایلهای صوتی سازگار با سیستمهای تلفنی (مانند IVR و Asterisk) بهینهسازی شده است و خروجی را مستقیماً با فرمت استاندارد WAV (PCM, 16-bit, 8000Hz) ارائه میدهد.
-
خروجی مخصوص تلفن: به طور خودکار صدا را به فرمت 8kHz مونو مورد نیاز سیستمهای تلفنی تبدیل میکند.
-
کیفیت بالا: از مدل قدرتمند
gemini-2.5-flash-preview-ttsبرای تولید صدای طبیعی و واضح استفاده میکند. -
انتخاب صدا: امکان انتخاب از بین دهها صدای مختلف (زن و مرد) با توصیف هر کدام.
-
رابط کاربری تمیز: طراحی شده با Tailwind CSS برای یک تجربه کاربری ساده و ریسپانسیو.
-
بدون نیاز به سرور: کاملاً در مرورگر کاربر اجرا میشود (Client-Side).
-
رایگان و متن-باز: استفاده و ویرایش این ابزار تحت لایسنس MIT رایگان است.
-
دریافت کلید API:
-
به Google AI Studio بروید.
-
یک پروژه جدید بسازید و یک کلید API (API Key) دریافت کنید.
-
-
قراردادن کلید API:
-
فایل
index.htmlرا با یک ویرایشگر متن باز کنید. -
به ابتدای تگ
<script>(حدود خط 168) بروید. -
کلید API خود را در متغیر
USER_API_KEYقرار دهید:const USER_API_KEY = "اینجا_کلید_API_خود_را_قرار_دهید";
-
-
اجرای ابزار:
-
فایل
index.htmlرا در مرورگر خود باز کنید (با دوبار کلیک کردن روی آن). -
متن مورد نظر خود را در کادر "متن اسکریپت" بنویسید.
-
صدای دلخواه خود را انتخاب کنید.
-
دکمه "پخش صدا" را بزنید.
-
-
دریافت خروجی:
-
پس از چند ثانیه، صدا پخش میشود.
-
میتوانید با کلیک بر روی دکمه "دانلود صدا (8kHz)" فایل
wavرا مستقیماً دریافت کنید.
-
این پروژه تحت لایسنس MIT منتشر شده است. این به این معنی است که شما آزاد هستید تا از این کد برای هر منظوری (تجاری یا شخصی) استفاده کنید، آن را تغییر دهید و توزیع کنید.
ساخته شده با ❤️ برای جامعه متن-باز.