به آینده خوش آمدید
مقایسه صدا گاتا
API/SDK تشخیص جنسیت صدای PresentID می تواند جنسیت گوینده را تشخیص دهد.
ما یک روش مبتنی بر یادگیری عمیق را برای تأیید گوینده پیشنهاد کردهایم. تیم ما بیش از یک سال روی این پروژه کار کرده است و دقت آن از معیارهایی مانند دقت مقاله گروه اندرو زیسرمن از دانشگاه آکسفورد فراتر رفته است. برخلاف سایر روشهای وابسته به متن، سیستم ما مستقل از متن و زبان است.
سرعت پردازش مدل ما کمتر از 1 ثانیه است. این سیستم به سادگی با بررسی دو صدای 4 ثانیه ای فرد را شناسایی می کند. سیستم ما به زبان های انگلیسی، فرانسوی، اسپانیایی، آلمانی، فارسی و عربی حتی در محیط های پر سر و صدا کاملاً کار می کند.
سرعت پردازش مدل ما کمتر از 1 ثانیه است. این سیستم به سادگی با بررسی دو صدای 4 ثانیه ای فرد را شناسایی می کند. سیستم ما به زبان های انگلیسی، فرانسوی، اسپانیایی، آلمانی، فارسی و عربی حتی در محیط های پر سر و صدا کاملاً کار می کند.
امکانات، کربردها و نحوه استفاده
امکانات
دقت بیشتر از 96 درصد.زمان پردازش کمتر از 1 ثانیهبدون نیاز به GPUمستقل از زبان و متنپشتیبانی از دستگاه های iOS، اندروید، ویندوز و مک.ادغام آسان با برنامه شما
قوانین و محدودیت ها
داده ها را از طریق base64 یا URL صوتی یا فایل صوتی ارسال کنید.صدا باید بین سه ثانیه تا یک دقیقه طول بکشد.صداها نباید از 5 مگابایت تجاوز کنند.انواع فایل های پشتیبانی شده: wav، mp3، mp4، flac، aac، ogg.
موارد استفاده کنید
مرکز تماس