Yapay Zeka Metin Düzeltmenin Sihri

·tover0314·10 dk okuma süresi

Ham konuşmadan metne çıktı dağınıktır. Noktalama işaretleri eksiktir, dilbilgisi hataları vardır, 'hm' ve 'yani' gibi dolgu sözcükleri içerir ve teknik terimlerin büyük-küçük harf kullanımı genellikle yanlıştır. Bu, hangi STT sağlayıcısını kullanırsanız kullanın geçerlidir — en iyileri bile temizlenmesi gereken çıktılar üretir. OpenTypeless'un yapay zekâ düzeltme adımı, bu ham çıktıyı temiz, profesyonel ve kullanıma hazır metne dönüştüren adımdır.

Yapay Zekâ Metin Düzeltme Nedir?

Yapay zekâ metin düzeltme, ham transkripsiyon çıktısını temizlemek için büyük bir dil modeli (LLM) kullanma sürecidir. Bunu, dikte ettiğiniz her cümleyi inceleyen yetenekli bir editör gibi düşünün — dilbilgisini düzeltir, noktalama işaretleri ekler, sözel tikleri kaldırır ve metni doğal bir şekilde biçimlendirir. Geleneksel dilbilgisi denetleyicilerinden temel farkı, LLM'lerin bağlamı ve niyeti anlamasıdır; böylece neyin düzeltileceği ve neyin korunacağı konusunda akıllı kararlar verebilirler.

OpenTypeless'da düzeltme, her transkripsiyondan sonra otomatik olarak gerçekleşir. Konuşmanız önce STT sağlayıcısından geçer, ardından ham metin özenle hazırlanmış bir sistem istemiyle birlikte seçtiğiniz LLM'e gönderilir. LLM, orijinal anlamınızı koruyarak ifadeyi temizleyen düzeltilmiş metni döndürür. Tüm süreç boru hattına yalnızca 200-500 ms ekler — pratikte neredeyse fark edilmez.

Boru Hattı Nasıl Çalışır

Düzeltme boru hattı hızlı ve güvenilir olacak şekilde tasarlanmıştır. STT sağlayıcısı ham metni döndürdükten sonra OpenTypeless, şu unsurları içeren bir istem oluşturur: ham transkripsiyon, özel sözlük terimleriniz (varsa) ve LLM'e metni nasıl düzelteceğine dair talimatlar. İstem, anlamı korumak, tonu sürdürmek ve kod parçacıkları, URL'ler ve teknik terminoloji gibi özel durumları ele almak için dikkatle ayarlanmıştır.

Sistem istemi LLM'e şunları yapmasını söyler: dilbilgisi ve noktalama hatalarını düzeltmek, dolgu sözcüklerini ve sözel tereddütleri kaldırmak, özel isimleri ve teknik terimleri doğru şekilde büyük harfle yazmak, konuşmacının orijinal tonunu ve niyetini korumak, kod veya teknik içeriği aynen korumak ve özel sözlük düzeltmelerini uygulamak. Bu istem, en yaygın konuşma kalıplarını ele almak için binlerce gerçek dünya transkripsiyonu üzerinden iyileştirilmiştir.

Loading animation…

Öncesi ve Sonrası Örnekleri

Yapay zekâ düzeltmeyi anlamanın en iyi yolu onu uygulamada görmektir. İşte OpenTypeless kullanıcılarından ham konuşmadan düzeltilmiş metne dönüşümü gösteren gerçek örnekler.

Ham konuşma transkripsiyonu ile yapay zekâ düzeltilmiş çıktının yan yana karşılaştırması
Ham transkripsiyon ile yapay zekâ düzeltilmiş çıktı — aynı anlam, belirgin şekilde daha temiz metin

Örnek 1: Teknik Tartışma

Ham: 'yani aslında bence yeni özelliği react server components kullanarak uygulamalıyız ve belki biraz önbellekleme eklemeliyiz biliyorsun ve hm ayrıca veritabanı şemasını da düşünmemiz lazım herhalde'. Düzeltilmiş: 'Yeni özelliği React Server Components kullanarak uygulamamız ve önbellekleme eklememiz gerektiğini düşünüyorum. Ayrıca veritabanı şemasını da ele almamız gerekiyor.' Dolgu sözcükleri kaldırıldı, büyük-küçük harf kullanımı doğru ve metin doğal okunuyor.

Örnek 2: E-posta Taslağı

Ham: 'selam geçen haftaki raporu bana gönderebilir misin yarın sabahki toplantı için lazım ayrıca bütçe rakamlarının güncellenip güncellenmediğini de haber ver teşekkürler'. Düzeltilmiş: 'Selam, geçen haftaki raporu bana gönderebilir misin? Yarın sabahki toplantı için lazım. Ayrıca bütçe rakamlarının güncellenip güncellenmediğini de haber ver. Teşekkürler!' Noktalama işaretleri eklendi, cümleler düzgün şekilde ayrıldı ve samimi ton korundu.

Örnek 3: Kod İnceleme Yorumu

Ham: 'bu fonksiyon muhtemelen any tipleri yerine typescript generics kullanmalı ve api çağrısı için hata yönetimi eklemeliyiz ayrıca değişken adı user data camel case olmalı'. Düzeltilmiş: 'Bu fonksiyon `any` tipleri yerine TypeScript generics kullanmalı. API çağrısı için hata yönetimi eklemeliyiz. Ayrıca `userData` değişken adı camelCase olmalı.' Teknik terimler doğru biçimlendirildi ve kod referansları uygun şekilde işaretlendi.

LLM Sağlayıcı Seçimi

OpenTypeless, metin düzeltme için her biri hız, kalite ve maliyet arasında farklı dengelere sahip 11 LLM sağlayıcısını destekler. LLM seçimi, düzeltilmiş çıktının ne kadar doğal ve doğru hissettirdiğini etkiler. İşte en popüler seçeneklerin bir dökümü.

Hız, kalite ve maliyet derecelendirmelerini gösteren LLM sağlayıcı karşılaştırma matrisi
LLM sağlayıcı karşılaştırması: metin düzeltme için hız, kalite ve maliyet

Hız İçin: Groq

Groq, özel LPU donanımında Llama gibi açık kaynaklı modelleri çalıştırarak 100 milisaniyenin altında yanıtlar sunar. Her milisaniyenin önemli olduğu sesli girişte Groq, düzeltme adımını anlık hissettirir. Kalite iyidir — tam olarak GPT-4o seviyesinde değil, ancak konuşma transkripsiyonlarını temizlemek için fazlasıyla yeterli. Groq, yanıt hızını ön planda tutan kullanıcılar için varsayılan öneridir.

Kalite İçin: OpenAI GPT-4o veya Claude

En doğal, insana en yakın düzeltilmiş metin istiyorsanız, OpenAI GPT-4o ve Claude en iyi sonuçları üretir. Nüansları, ton korumayı ve karmaşık cümle yeniden yapılandırmasını küçük modellerden daha iyi ele alırlar. Ödün olarak biraz daha yüksek gecikme (300-800 ms) ve token başına daha yüksek maliyet vardır. Kalitenin en çok önem taşıdığı profesyonel yazılar, e-postalar ve belgeler için bunlar en iyi seçeneklerdir.

Maliyet İçin: DeepSeek

DeepSeek, OpenAI veya Claude maliyetinin çok küçük bir bölümüne mükemmel düzeltme kalitesi sunar. Modelleri özellikle teknik içerik ve kodla ilgili metinlerde güçlüdür. Günde binlerce kelime işleyen yoğun bir sesli giriş kullanıcısıysanız, DeepSeek'in fiyatlandırması kaliteden fazla ödün vermeden en ekonomik seçeneği sunar.

Gizlilik İçin: Ollama

Ollama, LLM'leri tamamen yerel makinenizde çalıştırır — hiçbir veri bilgisayarınızdan çıkmaz. Bu, tıbbi notlar, hukuki belgeler veya özel kod tartışmaları gibi hassas içerikler için ideal olan nihai gizlilik seçeneğidir. Ödün olarak yerel modeller bulut tabanlı olanlara göre daha yavaş ve daha az yeteneklidir, ancak temel metin temizliği için iyi çalışırlar. Sorunsuz performans için en az 8 GB RAM ve iyi bir GPU'ya sahip bir makineye ihtiyacınız olacaktır.

Özel Sözlük

Özel sözlük, teknik kullanıcılar için OpenTypeless'un en güçlü özelliklerinden biridir. Sözlüğünüze terimler eklediğinizde, LLM düzeltme sırasında bunları tam olarak yazıldığı gibi koruması gerektiğini bilir. Bu, 'kubernetes'in 'Kubernetes'e, 'postgres'in 'PostgreSQL'e, 'nextjs'in 'Next.js'e dönüşmesi ve şirketinizin ürün adlarının her zaman doğru şekilde büyük harfle yazılması anlamına gelir. Sözlük tüm LLM sağlayıcılarıyla çalışır ve teknik transkripsiyonların doğruluğunu önemli ölçüde artırır.