Skip to content

A powerful and flexible tool for generating professional IVR (Interactive Voice Response) audio files for telephony systems.

License

Notifications You must be signed in to change notification settings

pourjanali/IVR-Audio-Generator

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

🔊 مولد صوتی IVR (متن به گفتار)

یک ابزار ساده، رایگان و متن-باز تحت وب برای تبدیل متن به گفتار (TTS) با استفاده از Google's Gemini API.

این ابزار به طور خاص برای تولید فایل‌های صوتی سازگار با سیستم‌های تلفنی (مانند IVR و Asterisk) بهینه‌سازی شده است و خروجی را مستقیماً با فرمت استاندارد WAV (PCM, 16-bit, 8000Hz) ارائه می‌دهد.

✨ ویژگی‌ها

  • خروجی مخصوص تلفن: به طور خودکار صدا را به فرمت 8kHz مونو مورد نیاز سیستم‌های تلفنی تبدیل می‌کند.

  • کیفیت بالا: از مدل قدرتمند gemini-2.5-flash-preview-tts برای تولید صدای طبیعی و واضح استفاده می‌کند.

  • انتخاب صدا: امکان انتخاب از بین ده‌ها صدای مختلف (زن و مرد) با توصیف هر کدام.

  • رابط کاربری تمیز: طراحی شده با Tailwind CSS برای یک تجربه کاربری ساده و ریسپانسیو.

  • بدون نیاز به سرور: کاملاً در مرورگر کاربر اجرا می‌شود (Client-Side).

  • رایگان و متن-باز: استفاده و ویرایش این ابزار تحت لایسنس MIT رایگان است.

🚀 نحوه استفاده

  1. دریافت کلید API:

    • به Google AI Studio بروید.

    • یک پروژه جدید بسازید و یک کلید API (API Key) دریافت کنید.

  2. قراردادن کلید API:

    • فایل index.html را با یک ویرایشگر متن باز کنید.

    • به ابتدای تگ <script> (حدود خط 168) بروید.

    • کلید API خود را در متغیر USER_API_KEY قرار دهید:

      const USER_API_KEY = "اینجا_کلید_API_خود_را_قرار_دهید";
      
      
  3. اجرای ابزار:

    • فایل index.html را در مرورگر خود باز کنید (با دوبار کلیک کردن روی آن).

    • متن مورد نظر خود را در کادر "متن اسکریپت" بنویسید.

    • صدای دلخواه خود را انتخاب کنید.

    • دکمه "پخش صدا" را بزنید.

  4. دریافت خروجی:

    • پس از چند ثانیه، صدا پخش می‌شود.

    • می‌توانید با کلیک بر روی دکمه "دانلود صدا (8kHz)" فایل wav را مستقیماً دریافت کنید.

📄 لایسنس

این پروژه تحت لایسنس MIT منتشر شده است. این به این معنی است که شما آزاد هستید تا از این کد برای هر منظوری (تجاری یا شخصی) استفاده کنید، آن را تغییر دهید و توزیع کنید.

ساخته شده با ❤️ برای جامعه متن-باز.

About

A powerful and flexible tool for generating professional IVR (Interactive Voice Response) audio files for telephony systems.

Resources

License

Stars

Watchers

Forks

Languages