Anadolu Ajansı T.A.Ş. - Fotoğraf Takip Sistemi
Anadolu Ajansı T.A.Ş. - Fotoğraf Takip Sistemi
Proje İçeriği
Anadolu Ajansı yaklaşık 100 yıllık bir geçmişin getirdiği zengin bir arşive sahiptir. Sahip olduğu zengin fotoğraf arşivi ile yayın organları ve kurumlar tarafından hem haber hem de fotoğraf arşivine sıkça başvurulmaktadır. Anadolu Ajansı günlük olarak; 13 farklı dilde, ortalama olarak 2,000 haber, 3000 fotoğraf, 500 video yayınlamaktadır. Anadolu Ajansının üretip yayınladığı bu içerikler; yerel ve ulusal yayın organları (gazete, web sitesi, TV vb.) başta olmak üzere, birçok uluslar arası yayın organları tarafından kullanılmaktadır. Anadolu Ajansının tüm dillerde yayınladığı haber ve fotoğrafların; yazılacak bir uygulama ile internet siteleri ve gazeteler üzerinde aranarak, Anadolu Ajansın ait haber ve fotoğrafların tespit edilmesi ve raporlanması ihtiyacı bulunmaktaydı. Anadolu Ajansı yurt içi ve yurtdışı merkezli yaklaşık 1900 adet ulusal ve yerel abonesi bulunmaktadır. Anadolu Ajansı üretimini yapıp yayına verdiği içerikler; abonelerin yanında, abone olmayan birçok medya kuruluşu tarafından da kaçak olarak kullanılmaktadır. Telif hakları yasası gereği, bu şekilde kullanım yasak olup; kullananlar para ve hapis cezalarına çarptırılabilmektedir. Bu nedenle, Anadolu Ajansı’nın yayınladığı fotoğrafların gazete, dergi ve dijital ortamlarda (internet medyası) aranıp, kullanım miktarlarını izinsiz kullanım durumlarını ve muhabir performanslarını ölçmek amacıyla 2017 yılında Fotoğraf Takip Sistemi adı altında yeni projenin geliştirilmesine başlanmıştır. 2019 yılı başında devreye alınan proje, Anadolu Ajansı’nın günlük olarak yayınladığı fotoğrafları, daha önceden sisteme tanımlanan internet sitelerinde ve ajansa günlük olarak 1600 farklı gazeteye ait kupürler üzerinde aramakta ve eşleşen fotoğraflar ile ilgili raporlar oluşturmaktadır. Bu raporlardan hangi fotoğrafın kaç internet sitesi veya gazetede kullanıldığı, kullanan yayın organlarının ajansa abone olup/olmadığı, dolayısıyla kaçak kullanım yapıp yapmadığı, hangi muhabirin fotoğrafının en çok kullanıldığı gibi bilgilere erişilebilmektedir. Bu proje içerisinde Anadolu Ajansı iki farklı mecrada fotoğraf takibi yapabilmektedir. 1- Basılı Medya (Ulusal ve yerel gazeteler, dergiler vb.) 2- Dijital Medya (İnternet Haber Siteleri) Anadolu Ajansı bu proje öncesinde, üretip abonelerine servis ettiği haber ve fotoğrafları basılı ve internet medyalarında kullanımları takip edemediği için; izinsiz kullanım oranı bir hayli yüksekti. Bu nedenle ajans çok ciddi bir gelir kaybına uğramaktaydı. Diğer taraftan ajansın ürettiği içerikler telif hakları yasasına tabii olduğu için bu içeriklerin izinsiz kullanımı yasal olarak suç teşkil etmektedir. Basılı medyaların takip edilmesi sürecinde; gazete ve dergilerin tüm ekleriyle birlikte dijital kopyaları üzerinden haber kupürleri çıkarılıp; habere ilişkin text metin ve haber fotoğrafı ilişkilendirilerek bir birinden ayrılmaktadır. Daha sonrasında içerikten temizlenmiş fotoğraf ile Anadolu Ajansının orijinal fotoğrafları üzerinden farklı resim işleme algoritmaları kullanılarak aranmakta ve eşleşen fotoğraf bulunabilmektedir Aranan fotoğraf karmaşık Image Processing işlemleri ve resim analiz algoritmalarından geçirilerek; ajansa ait olup olmadığı net olarak tespit edilmektedir. Dijital medya yayın organlarının takibinde ise; özel olarak yeni nesil bir arama motoru geliştirilmiştir. Bu arama motoru kendisine tanımlı olan siteler üzerinde sürekli olarak gezinerek; var olan içerikleri indirilip; metin ve görsel içerikleri birbirinden ayırmaktadır. Bulunan görseller, fotoğraf arama algoritmalarına sokularak; içeriğin ajansa ait olup olmadığı net bir şekilde tespit edilmektedir. Yapılan aramalar sonucunda elde edilen analizlerin ardından; takip edilen medya organının abone olup olmamasına göre izinli/izinsiz kullanım raporları; haberlerin medya organlarında kullanım oranlarının raporları ve yayınların haber kategorilerinde yer alan haberlerin kullanım istatistikleri gibi birçok rapor alınabilmektedir. AA bünyesinde üretilen fotoğrafların; akademik çalışmalar ışığında en uygun yapı olarak öne çıkan Vocabulary Tree kullanılarak, her bir fotoğrafın bir kelime grubu gibi değerlendirilmesi ve bu şekilde bir index oluşturulması yoluna gidilmiştir. Gazete ve dergilerdeki kupürler ile internet sitelerinde tespit edilen fotoğraflar; ihtiyaca göre ön-işlemlerden geçirilerek bahsedilen index üzerinden aranıp bulunan eşleşmeler depolanmaktadır. Haber ve Fotoğraf Takip Sistemi’nin entegre çalışması ile, çeşitli istatistikler, raporlar alınabilmekte ve abonelik dışı kullanımlar rahatlıkla takip edilebilmektedir. Gazete ve dergilerde kullanılan fotoğrafların genellikle temiz diye niteleyebileceğimiz, sadece fotoğrafın kendisini içeren bir şekilde değil de, daha çok kırpılmış, çevrilmiş, üzerine yazı ve farklı fotoğraf eklenerek zenginleştirilmiş yani editoryal olarak işlenmiş içerikler olması nedeniyle, bu tür fotoğraflar index üzerinden aranmadan evvel, deep-learning uygulanmış bir ön-işlemden geçirilerek yazılarından arındırılmaktadır. Aksi takdirde, yazı gibi bol köşeli ve keskin hatlı içerikler, fotoğrafın ana öznelerini baskılamakta ve fotoğrafın ana niteliklerini yani feature-point’lerini çıkartırken hatalı eşleşmelere mahal verebilmektedir. Bu proje sayesinde, daha önceden manuel olarak yapılan bu süreç, otomatik hale getirilmiş; kullanım temelli aramalara ek olarak, kendi dijital arşivimizden fotoğraf aranmasını da kolaylaştırmıştır. Tüm bu süreç ciddi bir iş yükünü de beraberinde getirdiğinden, yazılım grubu yatayda genişletilebilir N adet sunucuyu destekler nitelikte bir GRID olarak tasarlanmıştır. Böylece gelecekte ihtiyaçlarımız mevcut kapasite ile karşılanamaz hale gelirse, yeni sunucular eklenerek genişletilebilmektedir.
Projenin Amacı
Anadolu Ajansı bu projeden önce, yayınladığı haberlerin takibini insan gücü ile yapmaktaydı. Günlük olarak gazetelerden yayınlanan fotoğraflar insan gücüyle bulunmakta ve kullanım rakamları oluşturulmaktaydı. Dolayısıyla hataya açık bu yöntemle, kullanılan bir çok fotoğraf tespit edilememekte, kullanılan fotoğrafın da ajansa ait olup olmadığı net olarak bilinememekteydi. Dijital ortamda ise herhangi bir içerik kullanım takibi yapılmamaktaydı. Bu proje ile insan gücüyle yapılan izleme ve takip çalışmaları, otomatik bir sistem haline dönüştürülerek daha hızlı ve kesin kararların alınmasına imkan tanımıştır. Diğer taraftan bu yazılım sayesinde izin kullanım yapan birçok medya organı Anadolu Ajansına abone olması sağlanmıştır. Bu da pazarlama birimi için ek bir gelir kaynağı yaratmıştır.
Proje içindeki en büyük inovasyon nedir? (yeni bir teknoloji veya var olan teknolojinin farklı kullanımı gibi. IOT, M2M, AI vb.)
Her bir fotoğrafın aslında bir metinmiş gibi değerlendirmesine olanak sağlayan akademik çalışmalar neticesinde başarısı onaylanmış Vocabulary Tree yapısında, SIFT algoritması ile feature-point ‘leri çıkarılmıştır. Buna ek olarak deep-learning algoritmaları ile fotoğraflardan yazıların temizlenmesi ve tüm bu süreçlerin ise yatayda genişleyebilir bir mimariye oturtulması sağlanmıştır. Sistem temelde HADOOP mimarisi temeline özgü bir yapıda kurgulanmıştır. Bu mimari ile günlük olarak yaklaşık 25.000 gazete kupürü ve 15.000’den fazla web sitesi üzerinden indirilen 500.000’den fazla internet linkleri indirilmekte ve işlenmektedir. Bu işlem gün içerisinde sürekli bir döngü halinde devam ettirilmektedir. Sistem her bir fotoğraf için yaklaşık 1.000 adet anahtar kelime (feature-point) çıkarmakta, ve aramaları bu anahtar kelimeler üzerinden yapmaktadır. Gün içinde indirilen yaklaşık 250.000 fotoğraf, 7.000.000’dan fazla Anadolu Ajansı arşiv fotoğraflarıyla kıyaslanmakta ve eşleşen fotoğraf bulunmaktadır.
Proje kurum içindeki hangi bölüme fayda sağlamıştır?(satış, pazarlama, finans, İK, IT, Üretim, Planlama, Satın alma, Lojistik Müşteri İlişkileri gibi)
Abonelik dışı kullanımları takip eden Pazarlama ve Kurumsal İletişim Direktörlüğü, fotoğrafların etkisini ve kullanımını takip etmek isteyen ve buna göre hangi alanlara daha fazla eğilmek gerektiğinin analizini yapabilecek olan Görsel Haberler Yayın Yönetmenliği ile muhabir performans değerlendirmelerinin takip edildiği Haber Takip ve Analiz birimi bu süreçten fayda görmüştür. Ek olarak her bir foto muhabiri kendisine ait fotoğrafları takip ederek kişisel olarak gelişimlerine katkı sağlayabilme olanağı bulmaktadır. Bunun yanında AA’nın IP (intellectual property) olarak nitelenen görsel içeriğin hukuksal takibinin mümkün hale gelmesi tüm kurum için faydalı olmuştur. Bu proje sonrası Anadolu Ajansı fotoğraflarının kaçak kullanımları azalmış, abone sayısını artırmış ve gelirlerini ciddi oranda artırmıştır. Bu da hem pazarlama biriminin hem de hukuk biriminin iş yükünün azalmasına katkı sağlamıştır. Daha önceden bu sürecin manuel yürütülmesi sebebiyle, bu işe atanan insan kaynağı da, daha verimli kullanılabilmiştir.
Projenin hayata geçirilmesi konusunda üst yönetimin desteğini tam olarak alabildiniz mi?
Evet, konunun Anadolu Ajansının gelirlerine ciddi bir katkı sağlayacak olması, birimlerin iş yükünü azaltacak olması ve telif hakları yasasının uygulanabilmesi için hukuki bir zemin oluşturması nedeniyle üst yönetimin onay ve desteğini almıştır.
Proje sonunda ortaya çıkan sonuçları analiz edebildiniz mi? Rakamsal verilerle ifade eder misiniz?(ROI, maliyetlerde yüzdesel azalma, üretim süresinde azalma, hata payının düşmesi vs.)
Projenin devreye alınmasında önce basılı mecrada fotoğraf takibi insan gözüyle yapıldığı için, eşleşen fotoğrafın bulunma oranı çok düşüktü. Bu proje ile basılı gazetelerde fotoğraf bulunma oranı yaklaşık 5 kat artmıştır. Dijital ortamda (web siteleri) ise, hiçbir takip yapılamamaktaydı. Dolayısıyla buradaki rakamsal artış vermek doğru olmayacaktır. Proje devreye alındıktan sonraki 6 ay içerisinde Anadolu Ajansının abone sayısı 1300 civarından 1650 seviyelerine çıkmıştır. Sistem ile birlikte abone sayısında %27’lik bir artış görülmüştür. Uygulama öncesinde fotoğraf editörlüğünde, fotoğraf takibi ile ilgilenen birim kapatılarak; burada çalışan 5 personel daha farklı birimlere yönlendirilmiştir.
Projenizde şirket içinden kaç kişi aktif olarak görev almıştır? Ekip birimleri hakkında kısaca bilgi verir misiniz?
Projenin tüm modüllerinin geliştirilmesinde Uygulama Geliştirme Müdürlüğü bünyesinde toplam 8 personel görev almıştır. Servisin geliştirilmesi sürecinde 6, entegrasyon sürecinde ise 1, proje yönetim süreçlerinde ise 1 personel olacak şekilde ayrılabilir. Analiz aşamasında fotoğraf ve haber birimleriyle çeşitli toplantılar yapılmış, ayrıca pazarlama ve hukuk birimiyle yakın bir çalışma ortamıyla iş süreçleri belirlenmiştir. Sistem Müdürlüğü donanımların temini ve işletim sistemlerinin kurulması konusunda destek vermiştir.
Projenizde (varsa)işbirliği kurduğunuz veya destek aldığınız bilişim şirketlerini belirtiniz.
Bu süre zarfında Anadolu Ajansı için ortak depolama alanı çözümü üreten firma (Usishi Bilişim) ile işin saklama alanı ihtiyacı konusunda, konunun uzmanı olan akademik personeller ile de fotoğraf işleme metodolojileri konusunda yakın çalışma yapılmıştır.
Proje sırasında kullandığınız ve spesifik önemi olan markaları (varsa) belirtiniz. (Yazılım veya donanım markaları)
Computer Vision işleri için opencv, index için Apache Solr, uygulama gridi ve entegrasyon için Java kullanılmıştır. İşletim sistemi bağımsız olduğu için işletim sistemi ya da donanımdan bağımsızdır. Depolama alanı ihtiyaçları için Usishi firmasının ürünü olan buluthan disk sistemi kullanılmıştır.