Omni Betimleyici Kullanıcı Kılavuzu
Yapay Zeka ile Görsel Dünyaya Ses Veriyoruz.
Filmlere olan tutkumla başladı her şey. İyi bir sesli betimleme olmadan, en sevdiğim sahnelerdeki ne kadar çok detayın aslında kaybolduğunu fark ettiğimde aklıma bir fikir geldi: "Peki, yapay zeka bu işi bizim için kolaylaştırabilir miydi?" Sadece betimleme üreten değil, aynı zamanda kontrolü tamamen kullanıcıya veren bir araç hayal ettim. Aylar süren yoğun çalışma, sayısız deneme ve aşmak zorunda kaldığım teknik engellerden sonra, Omni Betimleyici'yi bu hayalin bir ürünü olarak geliştirdim.
İçindekiler
İsmin Anlamı Nedir?
İsimdeki "Omni", Latincede "her şey, bütün" anlamına gelir. Bu ismi seçtim çünkü bu aracın sadece tek bir amaca hizmet etmesini istemedim. Omni Betimleyici, evet, öncelikli olarak görme engelli bireyler için sesli betimlemeler oluşturarak medyayı erişilebilir kılmayı hedeflemektedir. Ancak amacı bununla sınırlı değildir.
Bu aynı zamanda bir keşif aracıdır. Bir film eleştirmeni, bir öğrenci, bir sanatçı veya sadece görsel detaylara meraklı herhangi biri, "Sahne Gezgini" veya "Daha Fazla Sor" gibi özelliklerle bir videonun katmanlarını daha önce hiç olmadığı kadar derinlemesine inceleyebilir. Omni Betimleyici, yapay zekanın "gözlerinden" dünyaya bakmak ve onu farklı bir şekilde anlamak için bir penceredir. Yani, "herkes için, her şeye yönelik bir betimleyicidir".
Sistem Gereksinimleri
Omni Betimleyici'den en iyi performansı almak için aşağıdaki minimum sistem gereksinimlerini karşılamanızı öneririm:
- İşletim Sistemi: Windows 10 veya üzeri (64-bit).
- Bellek (RAM): En az 4 GB RAM.
- Depolama: Uygulama ve geçici dosyalar için en az 500 MB boş disk alanı.
- İnternet Bağlantısı: Yapay zeka servislerine (Google Gemini, OpenAI) bağlanmak ve video indirmek için aktif bir internet bağlantısı zorunludur.
- Ekran Okuyucu: Tam erişilebilirlik için JAWS, NVDA veya Windows Ekran Okuyucusu gibi bir ekran okuyucu yazılımı önerilir.
Haydi Başlayalım: API Anahtarları Kurulumu
Omni Betimleyici, videoları analiz etmek ve seslendirmek için bulut tabanlı yapay zeka servislerini kullanır. Bu nedenle uygulamayı kullanmaya başlamadan önce kendi API anahtarlarınızı girmeniz gerekir.
- Ayarlar'ı Açın: Dosya menüsünden Ayarlar...'ı seçin (veya Ctrl + , tuşlarına basın).
- Yapay Zeka Ayarları Sekmesi:
- Gemini API Anahtarı: Video analizi için zorunludur. Anahtarınızı "Gemini API Anahtarı:" alanına yapıştırın. Google AI Studio'dan ücretsiz bir anahtar alabilirsiniz.
- OpenAI API Anahtarı (TTS için): Yüksek kaliteli seslendirme (TTS) için gereklidir. Anahtarınızı bu alana yapıştırın. Bu anahtar olmadan da Windows'un dahili seslerini kullanabilirsiniz, ancak en iyi sonuçlar için OpenAI önerilir. OpenAI Platformu'ndan bir anahtar alabilirsiniz.
- Kaydedin: Uygula veya Tamam'a tıklayarak ayarlarınızı kaydedin. Artık hazırsınız!
Güvenli Depolama: API anahtarlarınız, yalnızca sizin bilgisayarınızda, uygulamanın ayarlar dosyasında şifrelenerek güvenle saklanır ve ilgili yapay zeka servislerine bağlanmak dışında asla başka bir yere gönderilmez.
Hızlı Başlangıç: İlk Betimlemenizi Üretin
Haydi başlayalım! Şu basit adımları izlemeniz yeterli:
- Video Seçin: Ana penceredeki "Yerel Video Dosyası" gibi bir düğmeye tıklayın veya Dosya menüsünden videonuzu seçin.
- Hazır İstem Seçin (İsteğe Bağlı): Açılır menü, yapay zekaya yön veren hazır talimatları listeler. İlk denemeniz için "(Hazır İstem Seçilmedi)" seçeneğinde bırakmak harika bir başlangıç olacaktır.
- İşlemi Başlatın: Uygulama şimdi videonuzu analiz etmeye başlayacak. İlerlemeyi pencerenin altındaki "Uygulama Günlüğü" bölümünden takip edebilirsiniz. Bu işlem, videonun uzunluğuna göre birkaç dakika sürebilir.
İşlem bittiğinde, Betimlemeli Video Oynatıcı otomatik olarak açılacak ve yeni betimlenmiş videonuzun keyfini çıkarmaya başlayabileceksiniz!
Temel Özellikler
Betimlemeli Video Oynatıcı
Burası sizin kişisel, betimlemeli sinema salonunuz. Video normal şekilde oynatılırken, doğru anlarda bilgisayarınızda kurulu ekran okuyucu (JAWS, NVDA vb.) sizin için üretilen sesli betimlemeleri okuyacaktır.
- Oynatma Kontrolleri: Oynat/Duraklat, Geri/İleri Sar düğmelerini veya videoda istediğiniz yere atlamak için kaydırma çubuğunu kullanın.
- Mevcut Betimleme Alanı: O anki aktif betimlemenin metnini buradan takip edebilirsiniz.
- Düzenle ve İyileştir: Projeniz üzerinde tam kontrol için "Betimlemeleri Düzenle..." düğmesine tıklayın.
- Yapay Zeka Jeton Kullanımı: Bu alanda, işlem sırasında ne kadar yapay zeka "jetonu" harcandığını görerek API kullanımınızı takip edebilirsiniz.
Betimlemeleri Düzenleme: İyileştirme Gücü
Yapay zeka harika bir başlangıç noktası sunar, ancak gerçek kalite, yapılan iyileştirmelerle ortaya çıkar. Oynatıcıdaki "Betimlemeleri Düzenle..." düğmesi, projenizin her yönü üzerinde size tam kontrol sağlayan güçlü bir düzenleyici açar.
- Seç ve Değiştir: Üstteki açılır listeden herhangi bir betimlemeyi seçerek ayrıntılarını düzenleyiciye yükleyin.
- Zamanlamayı Ayarla:
Başlangıç Zamanı ve Bitiş Zamanı alanlarını doğrudan düzenleyin. Başlangıç zamanını değiştirdiğinizde, betimlemenin orijinal süresini korumak için bitiş zamanı otomatik olarak ayarlanır. Tüm zamanlar, videonuzun sınırları içinde olduğundan emin olmak için doğrulanır.
- Metni Yeniden Yaz: Netliği artırmak, ayrıntı eklemek veya yanlışlıkları düzeltmek için ana metin kutusundaki betimleme metnini serbestçe düzenleyin.
- Yeni Betimleme Ekle: Sıfırdan tamamen yeni bir betimleme oluşturmak için "Yeni Ekle..." düğmesine tıklayın. Zamanını ve metnini siz belirleyin.
- Betimlemeleri Sil: İstenmeyen bir betimlemeyi seçip "Sil" düğmesine tıklayarak kalıcı olarak kaldırın.
Çalışmanızı Kaydedin: Düzenleyicide yaptığınız değişiklikler (ekleme, silme, değiştirme) anında mevcut oturumunuza uygulanır. İşiniz bittiğinde, oynatıcıya geri dönmek için "Kapat" düğmesine tıklamanız yeterlidir. Güncellenmiş betimleme listeniz, hem oynatma hem de sonraki dışa aktarma işlemleri için kullanılacaktır.
Hazır İstemleri Yönetme
İstemler, yapay zekanın neye odaklanacağını belirleyen güçlü talimatlardır. İstemi değiştirerek birbirinden çok farklı tarzlarda betimlemeler alabilirsiniz.
- Hazır İstem Seçme: Bir videoyu işlemeden önce, ana penceredeki açılır menüden bir hazır istem seçin.
- Hazır İstemleri Yönetme: Dosya -> Hazır İstemleri Yönet... menüsüne gidin. Burada kendi özel istemlerinizi Ekleyebilir, Düzenleyebilir veya Silebilirsiniz. Bu, sık kullandığınız talimatları kaydetmek için birebirdir.
- Dile Özel Kayıt: Hazır istemleriniz, Ayarlar'da seçtiğiniz her dil için ayrı ayrı kaydedilir.
Sahne Hakkında Daha Fazla Sor
Bir karakterin elinde ne tuttuğunu veya arka plandaki tabelada ne yazdığını mı merak ettiniz? Bu özellik sayesinde sahneyle ilgili aklınıza takılan her şeyi sorabilirsiniz.
- Merak ettiğiniz anda videoyu duraklatın.
- Daha Fazla Sor... düğmesine tıklayın.
- "Yeni Sorunuz" alanına sorunuzu yazın (Örn: "Kadının şapkası ne renk?" veya "Duvardaki yazıda ne yazıyor?").
- Yapay zekanın imlecin bulunduğu yerden itibaren kaç saniyelik bir bölümü incelemesi gerektiğini seçin.
- "Soruyu Gönder"e tıklayın. Yapay zekanın cevabı "Sohbet Geçmişi" alanında belirecektir.
Sahne Gezgini
Sahne Gezgini, bir sahnenin mekansal düzenini anlamak için geliştirilmiş etkileşimli bir yöntemdir. Sizi, klavyenizle gezinebileceğiniz sanal bir odaya koyar.
- Detaylıca keşfetmek istediğiniz bir sahnede videoyu duraklatın.
- Sahneyi Keşfet... düğmesine ve ardından "Sahneyi Analiz Et"e tıklayın.
Artık Sahne Gezgini'ndesiniz. Keşfetmek için klavyenizi kullanın:
- Ok Tuşları: Sanal konumunuzu bir ızgara üzerinde hareket ettirir.
- D: Sahnenin genel düzeni hakkında ayrıntılı bir betimleme sunar.
- L: Sahnedeki tüm nesnelerin bir listesini bildirir.
- Shift + L: Bir nesne seçip doğrudan ona gitmek için "Hızlı Taşıma Modu"na geçin.
- Enter: Size en yakın nesnenin ayrıntılı bir betimlemesini alın.
- Escape: Sahne Gezgini'ni kapatır.
Çalışmanızı Dışa Aktarma
Betimlemelerinizi mükemmelleştirdikten sonra, oynatıcı penceresinden farklı formatlarda dışa aktarabilirsiniz:
- TXT'ye Dışa Aktar: Zaman damgalarını içeren basit bir metin dosyası.
- SRT'ye Dışa Aktar: VLC gibi video oynatıcılarla kullanabileceğiniz standart bir altyazı dosyası.
- Ses Dışa Aktar (MP3): Bu belki de en heyecan verici özelliktir. Betimlemelerinizi Ayarlar'da seçtiğiniz sesle (SAPI5 veya OpenAI) seslendirir, orijinal video sesiyle miksler ve betimlemeler sırasında arka plan sesini otomatik olarak kısarak her yerde dinleyebileceğiniz bir MP3 dosyası oluşturur.
Ayarlara Derinlemesine Bir Bakış
Ayarlar penceresi (Ctrl + ,), Omni Betimleyici'nin davranışını en ince ayrıntısına kadar kontrol etmenizi sağlar.
Genel Sekmesi
- Betimlemelerin mevcut konuşmayı kesmesine izin ver: İşaretlendiğinde, bir önceki betimleme bitmemiş olsa bile yeni bir betimleme hemen konuşmaya başlar. Her betimlemenin bir sonrakine geçmeden önce tamamen bitmesini sağlamak için bu işareti kaldırın. Çok hızlı sahneler için kullanışlıdır.
Yapay Zeka Ayarları Sekmesi
- Analiz için kare hızı: Yapay zekaya saniyede kaç video karesi gönderileceğini belirler. Düşük bir değer (örn: 5 fps) API maliyetlerini önemli ölçüde azaltabilir ve işlem sınırlarına takılmayı önlemeye yardımcı olabilir, ancak yapay zekanın çok hızlı eylemleri kaçırmasına neden olabilir.
- Video Parçalamayı Etkinleştir: Uzun videolar (10-15 dakikadan fazla) için yapay zeka bazen işlem kapasitesini aşabilir. Bu özellik, videoyu otomatik olarak daha küçük parçalara ayırır, bunları sırayla analiz eder ve sonuçları birleştirir. Uzun süreli içerikler için şiddetle tavsiye edilir.
- Güvenlik Filtrelerini Kapat (Dikkatli kullanın): Bu seçenek, yapay zekanın normalde hassas olarak işaretleyebileceği içerikleri işlemesine olanak tanıyabilir. Ancak bu, mutlak bir geçersiz kılma değildir. Çıktı yine de yapay zeka sağlayıcısının temel güvenlik politikalarına tabidir. Bu özelliği nasıl kullandığınızdan sizin sorumlu olduğunuzu unutmayın.
Ses Çıkışı Sekmesi
- Metinden Sese Motoru:
- SAPI5 (Windows Dahili): Windows ile birlikte gelen veya sizin yüklediğiniz sesleri kullanır. Ek bir API anahtarı gerektirmez. Uygulama, hem modern 64-bit seslere hem de eski 32-bit seslere erişebilir. Geçmiş sistemlerden kalan eski, favori sesleriniz varsa, "SAPI5 (32-bit Sesler)" seçeneğini seçerek bunları kullanabilirsiniz.
- OpenAI TTS (Yüksek Kalite): Daha doğal ve akıcı sesler üretir. Bu seçeneği kullanmak, ücretli bir OpenAI hesabı ve API anahtarı gerektirir. OpenAI için özel ses ön ayarları oluşturabilir ve yönetebilirsiniz.
En İyi Sonuçlar İçin İpuçları ve Püf Noktaları
Harika sesli betimlemeler üretmek bir sanattır. Yapay zeka bu sanatı icra etmede etkili bir yardımcı olsa da, en iyi sonuçları onu doğru yönlendirdiğinizde alırsınız.
Hazır İstemlerin Gücü: Sizin Yönetmen Direktifleriniz
Uygulamanın yapay zekaya öğrettiği bir dizi temel kural vardır (diyalog üzerine konuşmamak gibi). Ana ekrandaki Hazır İstem alanı ise sizin o videoya özel olarak verdiğiniz yönetmen direktifleriniz gibidir. İyi bir direktif, yapay zekanın belirli bir stile veya detaya odaklanmasını sağlar.
İpucu: "İsimlere Odaklan" İstemi
Çok sayıda karakterin olduğu bir videoda, isim takibini önceliklendirmek için özel bir istem oluşturabilirsiniz:
Bu video için en büyük önceliğin, diyaloglarda geçer geçmez doğru karakter isimlerini bulup kullanmak.
İpucu: "Atmosferi Anlat" İstemi
Görsel olarak zengin filmlerde, yapay zekayı çevreye odaklanması için şöyle yönlendirebilirsiniz:
Mekanı, atmosferi ve çevresel detayları betimlemeye odaklan. Aydınlatmadan, renklerden ve sahnenin genel ruh halinden bahset.
Hazır İstemlerde Nelerden Kaçınmalısınız?
Yapay zekanın temel prensiplerine (sadece görselleri betimlemek, diyalog üzerine konuşmamak) aykırı talimatlardan kaçının. Hatalı bir talimat kötü sonuçlara yol açabilir.
- Kötü İstem:
"Olan biten her şeyi anlat." Bu çok belirsizdir ve yapay zekanın önemsiz detayları betimlemesine neden olabilir.
- Kötü İstem:
"Karakterlerin ne dediğini söyle." Bu, "sadece görseller" kuralını ihlal etmesine neden olur.
Kısacası: İstemleri, iyi bir sesli betimlemenin temel kurallarını değiştirmek için değil, yapay zekanın odağını yönlendirmek için kullanın.
Sıkça Sorulan Sorular (SSS)
S: API anahtarlarım çalışmıyor. Ne yapmalıyım?
C: Öncelikle, anahtarın tamamını doğru bir şekilde kopyaladığınızdan emin olun. OpenAI için, TTS hizmeti ücretli olduğundan hesabınızda bir ödeme yöntemi ayarladığınızdan emin olun. Gemini için, Google Cloud projenizde API'nin etkinleştirildiğinden emin olun.
S: İşlem "MAX_TOKENS" hatasıyla neden başarısız oldu?
C: Bu, videonuzun yapay zekanın tek seferde işleyemeyeceği kadar uzun veya görsel olarak karmaşık olduğu anlamına gelir. Bu bir içerik hatası değil, bir kapasite sınırıdır. En iyi çözüm, Ayarlar -> Yapay Zeka Ayarları'na gidip "Video Parçalamayı Etkinleştir" seçeneğini işaretlemektir. Bu, videoyu yapay zeka için otomatik olarak daha küçük, yönetilebilir parçalara ayıracaktır.
S: Yapay zeka "Güvenlik Filtreleri" nedeniyle neden betimleme üretemedi?
C: Bu, yapay zekanın güvenlik sisteminin aşırı dikkatli olabildiği bilinen bir sorundur. Sırayla deneyebileceğiniz birkaç seçeneğiniz var: 1) Ayarlar -> Yapay Zeka Ayarları'na gidin ve "Güvenlik Filtrelerini Kapat"ı etkinleştirin (bu genellikle yardımcı olur). 2) Bu işe yaramazsa, yapay zekaya daha az veri göndermek için "Analiz için kare hızı"nı düşürmeyi deneyin. 3) Son çare olarak, "Gemini Model Geçersiz Kılma" ayarını kullanabilir ve gemini-2.5-pro yazabilirsiniz. Bu model daha güçlüdür ve hassas içerikleri daha iyi işleyebilir, ancak işlemesi daha uzun sürer ve ücretli bir API katmanındaysanız daha pahalı olabilir.
S: Eski seslerimden bazıları SAPI5 listesinde eksik. Nereye gittiler?
C: Modern Windows sistemleri 64-bit'tir, ancak birçok klasik ve sevilen metinden sese sesleri 32-bit idi. "Ses Çıkışı" sekmesindeki Ayarlar altında, "SAPI5 (64-bit)" ve "SAPI5 (32-bit)" için ayrı motor seçenekleri göreceksiniz. Eski seslerinize erişmek için sadece 32-bit motorunu seçin.
S: Betimlemelerin üretilmesi neden uzun sürüyor?
C: Süre; videonuzun uzunluğuna, internet hızınıza (videonun yapay zekaya yüklenmesi için), seçilen kare hızına ve yapay zeka hizmetlerinin o anki yoğunluğuna bağlıdır. Uzun videolar için "Video Parçalamayı Etkinleştir" özelliğini kullanmanız şiddetle tavsiye edilir.
Klavye Kısayolları
- Ctrl + O: Yerel Video Aç
- Ctrl + U: Doğrudan URL'den Aç
- Ctrl + Y: YouTube'dan Aç
- Ctrl + ,: Ayarları Aç
- F1: Yardım Görüntüle
Omni Betimleyici'yi kullandığınız için çok teşekkür ederim! Bu uygulama, görsel medyayı herkes için daha erişilebilir ve keyifli kılma arzumun bir yansıması. Sizin gibi kullanıcıların bu aracı kullanması ve geri bildirimde bulunması, projeyi geliştirmeye devam etmem için bana en büyük motivasyonu veriyor.
Geri Bildirim ve Destek
Bir sorunuz, hata bildiriminiz veya yeni bir özellik fikriniz mi var? Sizden haber almayı çok isterim! Bana ulaşmanın en iyi yolu e-postadır. Geri bildirimleriniz, Omni Betimleyici'yi daha da iyi hale getirmek için paha biçilmezdir.