Omni Betimleyici Kullanıcı Kılavuzu
Yapay Zeka ile Görsel Dünyaya Ses Katalım.
Filmlere olan tutkumla başladı her şey. İyi bir sesli betimleme olmadan, en sevdiğim sahnelerdeki ne kadar çok detayın aslında kaybolduğunu fark ettiğimde aklıma bir fikir geldi: "Peki, yapay zeka bu işi bizim için kolaylaştırabilir miydi?" Sadece betimleme üreten değil, aynı zamanda kontrolü tamamen kullanıcıya veren bir araç hayal ettim. Aylar süren yoğun çalışma, sayısız deneme ve aşmak zorunda kaldığım teknik engellerden sonra, Omni Betimleyici'yi bu hayalin bir ürünü olarak geliştirdim.
İçindekiler
- Omni Betimleyici Felsefesi
- Sistem Gereksinimleri
- Haydi Başlayalım: API Anahtarları Kurulumu
- Hızlı Başlangıç: İlk Betimlemenizi Üretin
- Temel Özellikler
- Gelişmiş Ayarlar Detaylı Bakış
- En İyi Sonuçlar İçin İpuçları ve Püf Noktaları
- Sıkça Sorulan Sorular (SSS)
- Klavye Kısayolları
- Teşekkür, İletişim ve Katkıda Bulunanlar
İsmin Anlamı Nedir?
İsimdeki "Omni", Latincede "her şey, bütün" anlamına gelir. Bu ismi seçtim çünkü bu aracın sadece tek bir amaca hizmet etmesini istemedim. Omni Betimleyici, evet, öncelikli olarak görme engelli bireyler için sesli betimlemeler oluşturarak medyayı erişilebilir kılmayı hedeflemektedir. Ancak amacı bununla sınırlı değildir.
Bu aynı zamanda bir keşif aracıdır. Bir film eleştirmeni, bir öğrenci, bir sanatçı veya sadece görsel detaylara meraklı herhangi biri, "Sahne Gezgini" veya "Daha Fazla Sor" gibi özelliklerle bir videonun katmanlarını daha önce hiç olmadığı kadar derinlemesine inceleyebilir. Omni Betimleyici, yapay zekanın "gözlerinden" dünyaya bakmak ve onu farklı bir şekilde anlamak için bir penceredir. Yani, "herkes için, her şeye yönelik bir betimleyicidir".
Sistem Gereksinimleri
Omni Betimleyici'den en iyi performansı almak için aşağıdaki minimum sistem gereksinimlerini karşılamanızı öneririm:
- İşletim Sistemi: Windows 10 veya üzeri (64-bit).
- Bellek (RAM): En az 4 GB RAM.
- Depolama: Uygulama ve geçici dosyalar için en az 500 MB boş disk alanı.
- İnternet Bağlantısı: Yapay zeka servislerine (Google Gemini, OpenAI) bağlanmak ve video indirmek için aktif bir internet bağlantısı zorunludur.
- Ekran Okuyucu: Tam erişilebilirlik için JAWS, NVDA veya Windows Ekran Okuyucusu gibi bir ekran okuyucu yazılımı önerilir.
Haydi Başlayalım: API Anahtarları Kurulumu
Omni Betimleyici, videoları analiz etmek ve seslendirmek için bulut tabanlı yapay zeka servislerini kullanır. Bu nedenle uygulamayı kullanmaya başlamadan önce kendi API anahtarlarınızı girmeniz gerekir.
- Ayarlar'ı Açın: Dosya menüsünden Ayarlar'ı seçin (veya Ctrl + , tuşlarına basın).
- Yapay Zeka Ayarları Sekmesi:
- Gemini API Anahtarı: Video analizi için zorunludur. Anahtarınızı "Gemini API Anahtarı:" alanına yapıştırın. Google AI Studio'dan ücretsiz bir anahtar alabilirsiniz.
- TTS için OpenAi api anahtarı: Yüksek kaliteli seslendirme (TTS) için gereklidir. Anahtarınızı bu alana yapıştırın. Bu anahtar olmadan da Windows'un dahili seslerini kullanabilirsiniz, ancak en iyi sonuçlar için OpenAI önerilir. OpenAI Platformu'ndan bir anahtar alabilirsiniz.
- Kaydedin: Uygula veya Tamam'a tıklayarak ayarlarınızı kaydedin. Artık hazırsınız!
Hızlı Başlangıç: İlk Betimlemenizi Üretin
Haydı başlayalım! Şu basit adımları izlemeniz yeterli:
- Video Seçin: Ana penceredeki "Yerel Video Dosyası" gibi bir düğmeye tıklayın veya Dosya menüsünden videonuzu seçin.
- Hazır İstem Seçin (İsteğe Bağlı): Açılır menü, yapay zekaya yön veren hazır talimatları listeler. İlk denemeniz için "Standart Betimleme" harika bir başlangıç olacaktır.
- İşlemi Başlatın: Uygulama şimdi videonuzu analiz etmeye başlayacak. İlerlemeyi pencerenin altındaki "Uygulama günlüğü" bölümünden takip edebilirsiniz. Bu işlem, videonun uzunluğuna göre birkaç dakika sürebilir.
İşlem bittiğinde, Betimlemeli Video Oynatıcı otomatik olarak açılacak ve yeni betimlenmiş videonuzun keyfini çıkarmaya başlayabileceksiniz!
Temel Özellikler
Betimlemeli Video Oynatıcı
Burası sizin kişisel, betimlemeli sinema salonunuz. Video normal şekilde oynatılırken, doğru anlarda bilgisayarınızda kurulu ekran okuyucu (JAWS, NVDA vb.) sizin için üretilen sesli betimlemeleri okuyacaktır.
- Oynatma Kontrolleri: Oynat/Duraklat, Geri/İleri Sar düğmelerini veya videoda istediğiniz yere atlamak için kaydırma çubuğunu kullanın.
- Mevcut Sesli Betimleme Alanı: O anki aktif betimlemenin metnini buradan takip edebilirsiniz.
- Betimlemeleri Düzenle: Bir betimleme hatalıysa, zamanlaması kaymışsa veya silmek istiyorsanız, "Betimlemeleri Düzenle..." düğmesine tıklayarak metni kolayca düzeltebilir veya silebilirsiniz.
- Yapay Zeka Jeton Kullanımı: Bu alanda, işlem sırasında ne kadar yapay zeka "jetonu" harcandığını görerek API kullanımınızı takip edebilirsiniz.
Hazır İstemleri Yönet
İstemler, yapay zekanın neye odaklanacağını belirleyen güçlü talimatlardır. İstemi değiştirerek birbirinden çok farklı tarzlarda betimlemeler alabilirsiniz.
- Hazır İstem Seçme: Bir videoyu işlemeden önce, ana penceredeki açılır menüden bir hazır istem seçin.
- Hazır İstemleri Yönetme: Dosya --> Hazır İstemleri Yönet... menüsüne gidin. Burada kendi özel istemlerinizi Ekleyebilir, Düzenleyebilir veya Silebilirsiniz. Bu, sık kullandığınız talimatları kaydetmek için birebirdir.
- Dile Özel Kayıt: Hazır istemleriniz, Ayarlar'da seçtiğiniz her dil için ayrı ayrı kaydedilir.
Sahne Hakkında Daha Fazla Sor
Bir karakterin elinde ne tuttuğunu veya arka plandaki tabelada ne yazdığını mı merak ettiniz? Bu özellik sayesinde sahneyle ilgili aklınıza takılan her şeyi sorabilirsiniz.
- Merak ettiğiniz anda videoyu duraklatın.
- Daha Fazla Sor... düğmesine tıklayın.
- "Yeni Sorunuz" alanına sorunuzu yazın (Örn: "Kadının şapkası ne renk?" veya "Duvardaki yazıda ne yazıyor?").
- Yapay zekanın imlecin bulunduğu yerden itibaren kaç saniyelik bir bölümü incelemesi gerektiğini seçin.
- "Soruyu Gönder"e tıklayın. Yapay zekanın cevabı "Sohbet Geçmişi" alanında belirecektir.
Sahne Gezgini
Sahne Gezgini, bir sahnenin mekansal düzenini anlamak için geliştirilmiş etkileşimli bir yöntemdir. Sizi, klavyenizle gezinebileceğiniz sanal bir odaya koyar.
- Detaylıca keşfetmek istediğiniz bir sahnede videoyu duraklatın.
- Sahneyi Keşfet... düğmesine ve ardından "Sahneyi Analiz Et"e tıklayın.
Artık Sahne Gezgini'ndesiniz. Keşfetmek için klavyenizi kullanın:
- Ok Tuşları: Sanal konumunuzu bir ızgara üzerinde hareket ettirir.
- D: Sahnenin genel düzeni hakkında ayrıntılı bir betimleme sunar.
- L: Sahnedeki tüm nesnelerin bir listesini bildirir.
- Shift + L: Bir nesne seçip doğrudan ona gitmek için "Hızlı taşı modu"na geçin.
- Enter: Size en yakın nesnenin ayrıntılı bir betimlemesini alın.
- Escape: Sahne Gezgini'ni kapatır.
Çalışmanızı Dışa Aktarma
Betimlemelerinizden memnun kaldığınızda, Oynatıcı Penceresi'nden farklı formatlarda dışa aktarabilirsiniz:
- .TXT Olarak Dışa Aktar: Zaman damgalı, sade bir metin dosyası.
- .SRT Olarak Dışa Aktar: VLC gibi video oynatıcılarda kullanabileceğiniz standart bir altyazı dosyası.
- Sesi Dışa Aktar (MP3): Belki de en heyecan verici özellik budur. Betimlemelerinizi, Ayarlar'da seçtiğiniz sesle (SAPI5 veya OpenAI) seslendirir, videonun orijinal sesiyle birleştirir ve betimleme anında arka plan müziğini/sesini otomatik olarak kısarak her yerde dinleyebileceğiniz bir MP3 dosyası oluşturur.
Gelişmiş Ayarlara Detaylı Bakış
Ayarlar penceresi (Ctrl + ,), Omni Betimleyici'nin davranışını en ince ayrıntısına kadar kontrol etmenizi sağlar.
Yapay Zeka Ayarları Sekmesi
- Analiz için kare hızı: Yapay zekaya gönderilecek videonun saniyedeki kare sayısını belirler. Düşük bir değer (örn: 5 fps) API maliyetini düşürebilir ancak çok hızlı hareketleri kaçırma ihtimali doğurur.
- Yapay Zekaya Videoyu Ses Olmadan Gönder: Videodaki seslerin (konuşmalar, müzik, efektler) yapay zekayı yanıltmasını önlemek için kullanışlı bir seçenektir. Yapay zeka, bir patlama sesini duyup bunu betimlemeye çalışmak yerine sadece görselde ne olduğuna odaklanır.
- Güvenlik Filtrelerini Kapat (Dikkatli kullanın): Bu seçenek, yapay zekanın normalde hassas olarak kabul edebileceği içerikleri işlemesine ve bu doğrultuda betimlemeler üretmesine olanak tanıyabilir. Ancak, bu ayar mutlak bir serbestlik sağlamaz. Üretilen içerik yine de Google'ın temel güvenlik politikalarına tabidir ve filtrelerin tamamen aşılacağının bir garantisi yoktur. Bu özelliği kullanırken sorumluluğun size ait olduğunu unutmayın.
Ses Çıkışı Sekmesi
- metinden sese motoru:
- sapi5 (windows varsayılan): Windows ile birlikte gelen veya sizin sonradan yüklediğiniz SAPI5 uyumlu sesleri kullanır. Ekstra API anahtarı gerektirmez. Ses kalitesi, sisteminizde kurulu olan seslerin kalitesine bağlı olarak değişiklik gösterir.
- OpenAi TTS (yüksek kalite): Genellikle daha doğal ve akıcı sesler üretir. Bu seçeneği kullanmak için bir OpenAI API anahtarına ve hesaba bağlı bir ödeme yöntemine ihtiyacınız vardır.
En İyi Sonuçlar İçin İpuçları ve Püf Noktaları
Harika sesli betimlemeler üretmek bir sanattır. Yapay zeka bu sanatı icra etmede etkili bir yardımcı olsa da, en iyi sonuçları onu doğru yönlendirdiğinizde alırsınız.
Hazır İstemlerin Gücü: Sizin Yönetmen Direktifleriniz
Hazır İstem Ne Zaman (ve Nasıl) Kullanılmalı?
Çoğu zaman yapay zeka, özel bir istem belirtilmediğinde bile, sadece temel kurallarına dayanarak oldukça iyi sonuçlar verebilir. Bu alanı, yalnızca belirli bir hedefe odaklanmak istediğinizde kullanmanızı öneririm.
Çok sayıda karakterin olduğu ve isimlerin önemli olduğu bir videoda, yapay zeka bazen bir ismi kullanmakta tereddüt edebilir. İsim takibini önceliklendirmek için özel bir istem oluşturabilirsiniz:
Bu video için en büyük önceliğin, diyaloglarda geçer geçmez doğru karakter isimlerini bulup kullanmak. Bu, aşırı kısa olmaktan daha önemli. Buna odaklanırken, diğer tüm sistem kurallarına da elinden geldiğince uymaya çalış.
Atmosferin kilit rol oynadığı görsel olarak zengin filmlerde, yapay zekayı çevreye odaklanması için şöyle yönlendirebilirsiniz:
Mekanı, atmosferi ve çevresel detayları betimlemeye odaklan. Zengin bir görsel dünya yaratmak için aydınlatmadan, renklerden ve sahnenin genel ruh halinden bahset. Kritik olmadıkça önemsiz karakter hareketlerine daha az odaklan.
Hazır İstemlerde Nelerden Kaçınmalısınız?
En iyi sonuçlar için, yapay zekanın temel çalışma prensiplerine ters düşen talimatlardan kaçınmak önemlidir. Yapay zeka her talimata uymaya çalıştığı için, verdiğiniz hatalı bir talimat videoyu yanlış yorumlamasına yol açabilir.
- Hatalı İstem Örneği:
"Olan biten her şeyi anlat."
Bu, yapay zekayı aşırı duyarsız yapabilir ve önemli önemsiz her detayı; örn. (karakter konuşuyor) gibi içeriği anlamak için önemli olmayan detaylara odaklanmasına neden olabilir. - Hatalı İstem Örneği:
"Karakterlerin ne konuştuğunu söyle."
Bu, "sadece görselleri betimle" kuralını ihlal etmesine ve "karakter bunu götür dedi" gibi diyalogları da betimlemesine yol açabilir.
Kısacası: Hazır istemleri, iyi bir sesli betimlemenin temel kurallarını değiştirmek için değil, yapay zekayı özel bir konuda yönlendirmek için kullanın.
Sıkça Sorulan Sorular (SSS)
S: API anahtarlarım güvende mi?
C: Evet. Anahtarlarınız sadece sizin bilgisayarınızda saklanır ve Google/OpenAI servislerine bağlanmak dışında asla kimseyle paylaşılmaz.
S: Betimlemelerin üretilmesi neden uzun sürüyor?
C: Bu süre; videonuzun uzunluğuna, internet hızınıza (videonun yapay zekaya yüklenmesi için), seçtiğiniz kare hızına ve o anki API servislerinin yoğunluğuna bağlıdır. Uzun videolar için "Video Parçalamayı Etkinleştir" özelliğini kullanmanız şiddetle tavsiye edilir.
S: Yapay zeka, ekranda gördüğüm bir şeyi neden betimlemedi?
C: Yapay zeka, emin olmadığı veya diyalogla çakışabileceğini düşündüğü bir şeyi betimlemek yerine sessiz kalmayı tercih edecek şekilde eğitilmiştir. Belirli anları sorgulamak için "Daha Fazla Sor..." özelliğini kullanabilir veya Ayarlar'dan "Ayrıntılı" detay seviyesini seçebilirsiniz.
Klavye Kısayolları
- Ctrl + O: Yerel Video Aç
- Ctrl + U: Doğrudan İndirilebilir Adresten Video Aç
- Ctrl + Y: YouTube'dan Video Aç
- Ctrl + ,: Ayarları Aç
- F1: Yardım belgesini görüntüle
Teşekkür, İletişim ve Katkıda Bulunanlar
Omni Betimleyici'yi kullandığınız için çok teşekkür ederim! Bu uygulama, görsel medyayı herkes için daha erişilebilir ve keyifli kılma arzumun bir yansıması. Sizin gibi kullanıcıların bu aracı kullanması ve geri bildirimde bulunması, projeyi geliştirmeye devam etmem için bana en büyük motivasyonu veriyor.
Geri Bildirim ve Destek
Bir sorunuz, hata bildiriminiz veya yeni bir özellik fikriniz mi var? Sizden haber almayı çok isterim! Bana ulaşmanın en iyi yolu e-postadır. Geri bildirimleriniz, Omni Betimleyici'yi daha da iyi hale getirmek için paha biçilmezdir.
- E-posta: info [at] audioses [dot] com. (Lütfen gönderirken '[at]' yerine '@' ve '[dot]' yerine '.' kullanın.)
- Website: audioses.com