Loading...
D4R CHALLENGE WORKSHOP
KATILIM ÜCRETSİZDİR
21 OCAK 2019

VERİ

Bu görev için, Türk Telekom tarafından baz istasyonu konumlarına ilişkin iki dosyayla birlikte, üç CDR (Arama Ayrıntısı Kaydı) veri seti sağlanacaktır.

Veri setleri, Ocak 2017 - Aralık 2017 arasında toplanan bir yıllık mobil CDR verilerini içerecektir. Veri seti hazırlanırken, haftada 1000'den düşük etkileşim ortalamasına sahip olan kullanıcılar kullanılacaktır (Haftada 1000'den fazla etkileşimi olan kullanıcılar makine veya paylaşımlı telefon kabul edilmektedir.)

Tüm veri setleri, düz metin formatında saklanacaktır. 

BAZ İSTASYONU KONUMLARI

BTS'lerin (Baz Alıcı-Verici İstasyon), mobil ağ antenlerinin bulunduğu yerlerin coğrafi koordinatları verilecektir. Birkaç BTS'nin ortak konumda olabileceği unutulmamalıdır. Her satır, ağ anteninin bulunduğu saha kimliğini ve bir semt kimliği içerir. Semt kimliği birkaç saha içerir.   

 

Örneğin:

saha_kimliği, semt_kimliği, boylam, eylem 

1,2,-17.5251,14.74683

2,2,-17.5244,14.74743

3,2,-17.5226,14.7452

4,2,-17.5164,14.74673

BÖLGE KONUMLARI

Kaba hareketlilik için baz istasyonları sağlanmamaktadır, yalnız her çağrı için ilçe bilgisi belirtilmektedir. Türkiye’de 971 ilçe bulunmaktadır. Verinin sağlandığı baz istasyonları, tüm ülke genelinde yaklaşık 481 ilçede toplanmıştır. Her ilçenin geometrik merkezi ayrı olarak kaydedilecektir.

 

Örneğin:

semt kimliği, semt ismi, şehir ismi, boylam, enlem 

1, Beşiktaş, İstanbul, -17.5251,14.74683

2, Sarıyer, İstanbul, -17.5164,14.74673

VERİ SETİ 1: ANTEN TRAFİĞİ

Saatlik olarak bir yıllık sahadan sahaya trafik verilmiştir.  Bu veri seti, bir yıl için her saha arasındaki trafiği içerir. SES için Veri_Seti1_201701 şeklinde, sahalar arasındaki aylık ses trafiğini içerir ve aşağıdaki şekilde yapılandırılır:

  

zaman damgası: YYYY-AA-GG SS (saat değerine yuvarlanır) formatında değerlendirilen gün / saat

  

giden_saha_kimliği: çağrının geldiği sahanın kimliği

  

gelen_saha_kimliği: çağrıyı alan sahanın kimliği

  

toplam_çağrı_sayısı: bu saat sırasında bu iki saha arasındaki çağrıların toplam sayısı

  

mültecilerden kaynaklanan çağrıların sayısı: mülteci statüsündeki numaralardan kaynaklanan çağrıların sayısı

  

toplam çağrı süresi: bu saat sırasında bu iki saha arasındaki tüm çağrıların toplam süresi

  

mültecilerden kaynaklanan toplam çağrı süresi: bu saat sırasında bu iki saha arasındaki mülteci kimliklerinden kaynaklanan çağrıların toplam süresi

 

Örneğin:

zaman damgası, giden_saha_kimliği, gelen_saha_kimliği,... ...çağrı_sayısı, mülteci_çağrıları, toplam_çağrı_süresi, mülteci_çağrı_süresi

2013-04-01 00,2,2,7,1,138,20

2013-04-01 00,2,3,4,0,136,0

2013-04-30 23,1659,608,0,1,0,3601

VERİ SETİ 2: İNCE HAREKETLİLİK

Bu veri seti, telefon araması yapmak ve metin göndermek için rastgele seçilmiş aktif kullanıcılar grubu tarafından kullanılan baz istasyonu tanımlayıcıları sağlayacaktır. Veriler, zaman damgalı olacak ve kullanıcı grubu 2 haftalık bir süre boyunca gözlemlenecektir. İki haftalık sürenin sonunda, aktif kullanıcılardan oluşan yeni bir örnek rastgele çekilecektir. Her bir örnek, mülteci tabanının %3'ü artı eşit miktarda mülteci dışı kullanıcı içerir. Mahremiyeti korumak için, her zaman aralığında yeni rastgele tanımlayıcılar seçilir. Zaman damgaları dakikaya yuvarlanır.

  

Bu kullanıcılar için telefon numaraları çıkarılır ve yerine, her biri için rastgele eşsiz bir numara atanır. Bu numaralar, mülteciler için 1, mülteci olmayan kullanıcılar için 2 ve bilinmeyenler için 3 ile başlayacaktır. Bununla birlikte, bu belirtecin gürültülü olduğu kabul edilmelidir. Mülteci olarak işaretlenen kullanıcılar arasında mülteci olmayan yabancılar, mülteci değil diye işaretlenen kullanıcılar arasında mülteciler olabilir. Bu şekilde, bir çağrının mülteci numarasına ait olup olmadığını kesin olarak söylemek mümkün olmayacaktırAranan, kayıtlarda yer almaz; yalnız alan kodu (1: mülteci, 2: mülteci değil, 3: bilinmiyor) verilir. 

  

Her bölge için birden fazla mobil operatör olduğu unutulmamalıdır. Dolayısıyla verilen telefon ve görüşme sayıları, bölgenin toplam konuşma miktarı ile ilgili göstergeler vermekle birlikte, gerçek toplam sayıları ifade etmemektedir. Eksik anten konumları için -99 veya 9999 sayıları verilmiştir. 

  

Sahalar arasındaki aylık ses trafiği SES için Veri_Seti2_201701W_In/Out biçiminde ve SMS için Veri_Seti2_201701W_SMS_In/Out biçiminde saklanır ve aşağıdaki şekilde yapılandırılır. Gelen SMS’ler 9333 servisinden veya farklı SMS servislerinden ve uygulamalarından gelmiş ise, aranan alan kodu=3 olarak değerlendirilmiştir.

 

arayan kimliği: rastgele atanan değer, mülteci statüsünü belirten hane eklenir (1: mülteci, 2: mülteci dışı, 3: bilinmiyor)

 

zaman damgası: YYYY-AA-GG SS:DD (dakikaya yuvarlanır) formatında değerlendirilen gün / saat

 

aranan alan kodu: 1: mülteci, 2: mülteci değil, 3: bilinmiyor

 

saha_kimliği: çağrıyı kaydeden sahanın kimliği 

  

çağrı tipi: giden için 1, gelen için 2

 

Örneğin:

caller id, timestamp, callee prefix, site id, call type

1138, 2013-04-01 12:32, 1, 52, 1

309095, 2013-04-01 12:33, 3, -1, 2

VERİ SETİ 3: KABA HAREKETLİLİK

Bu veri setinde, tüm gözlem dönemi için düşük mekansal çözünürlükle 50.000 rastgele seçilmiş mülteci ve 50.000 rastgele seçilmiş mülteci olmayan kullanıcıdan oluşan izlemeler sağlanır. 

  

Mekansal çözünürlük, anten tanımlayıcıları yerine ilçe bazında verilerek azaltılır. Türkiye haritası resmi olarak 981 ilçeye ayrılmıştır. Veri setimizde 481 ilçeden alınmış veri bulunmaktadır.

  

Veri_Seti3_201701_In/Out şeklinde aylara bölünmüş dosyalar, aşağıdaki formatta kayıtları içerecektir:

  

arayan kimliği: rastgele atanan değer, mülteci statüsünü belirten hane eklenir (1: mülteci, 2: mülteci değil)

  

zaman damgası: YYYY-AA-GG SS:DD (dakikaya yuvarlanır) formatında değerlendirilen gün / saat

  

ilçe_kimliği: çağrıyı kaydeden ilçenin kimliği

 

Örneğin:

arayan kimliği,  zaman damgası,  ilçe_kimliği 

1138,    2013-04-01 12:32,  167
209095,  2013-04-01 12:33,  23
176202,  2013-04-01 12:33,  75

MAHREMİYETİN KORUNMASI

Veri seti 1, baz istasyonu başına çağrı sayısı ve süresini içerir. Kullanıcılar hakkında kişisel olarak tanımlanabilir bilgiler içermediği için Veri seti 1 mahremiyet ihlaline yol açmaz. Bu set, süre boyunca trafik örüntülerini araştırmak için kullanılabilir ancak kullanıcılar ile ilgili hiçbir kişisel bilgi ortaya koymaz. Bu veri seti farklı alanların etkinlik seviyelerinin analizini sağlamanın yanı sıra, alanlar arasında iletişim bağlantıları kurulmasını mümkün kılar.

Veri seti 2, ayrıntılı arama kayıtları içerir. Kullanıcıların mahremiyetini korumak için, telefon numaraları rastgele numaralar ile değiştirilir ve herhangi bir kullanıcı için yalnız iki haftalık veri kaydedilir. Her bölge için sadece bir operatörden yapılmış konuşmaların bulunduğu unutulmamalıdır. Çağrının tam fiziksel konumu paylaşılmaz. Veri seti yalnız çağrıyı gerçekleştiren baz istasyonunun kimliğini kaydeder. Çağrılar (istasyonun ne kadar meşgul olduğuna ve arazinin fiziksel yerleşimine bağlı olarak) her zaman en yakın baz istasyonu tarafından gerçekleştirilmediğinden, bu da ilave bir koruma katmanı ekler.

Veri seti 3, tüm yıl için kayıt toplamaktadır, ancak fiziksel konum kabaca gösterilir. Burada da tüm kişisel bilgiler çıkarılır. Yalnız mülteci statüsü göstergesi vardır. Bununla birlikte, bu belirteç de kesin değildir, bu yüzden herhangi bir kaydın bir mülteciye ait olup olmadığını kesin olarak ifade etmek imkansızdır. 

 

“DATA FOR REFUGEES TÜRKİYE” BÜYÜK VERİ YARIŞMASI.
D4R CHALLENGE WORKSHOP
KATILIM ÜCRETSİZDİR
21 OCAK 2019
WELCOME

Welcome to the homepage of the Data for Refugees (D4R) Challenge Workshop. This workshop will gather stakeholders seeking to use Big Data for improving the living conditions of refugees. The Challenge participants will present their findings at the Workshop, and Awards will be distributed on different categories:
Health, education, social integration, unemployment, safety & security, respectively.

The presentations will be in English.

Date and Location

This workshop will take place on the 21th of January 2019 at Boğaziçi University, Albert Long Hall.

Participation and Registration

The workshop is free to attend, but security requires the names of attendees to enter the university on the day of the workshop. Please register if you like to attend.

First Name
Last Name
Email
Organization
Program

09:00 - 09:30   Opening talks (Boğaziçi University, TUBITAK, Türk Telekom)
09:30 - 10:00   D4R Challenge Award Ceremony
10:00 - 11:00   Session 1 (Oral)
Reducing measles risk in Turkey through social integration of Syrian refugees Paolo Bosetti, Piero Poletti, Massimo Stella, Bruno Lepri, Stefano Merler and Manlio De Domenico Data Analytics without Borders: Multi-Layered Insights for Syrian Refugee Crisis Ozgun Ozan Kılıç, Mehmet Ali Akyol, Oğuz Işık, Banu Günel Kılıç, Arsev Umur Aydınoğlu, Elif Sürer, Hafize Şebnem Düzgün, Sibel Kalaycıoğlu and Tuğba Taşkaya Temizel UDMIT: An Urban Deep Map for Integration in Turkey Sedef Turper Alışık, Damla Bayraktar Aksel, Asım Evren Yantaç, Lemi Baruh, Sibel Salman, İlker Kayı, Ahmet İçduygu and Ivon Bensason 11:00 - 12:00   Session 2 (Oral)
AROMA_CoDa: Assessing Refugees’ Onward Mobility through the Analysis of Communication Data Harald Sterly, Benjamin Etzold, Lars Wirkus, Patrick Sakdapolrak, Jacob Schewe, Carl-Friedrich Schleussner and Benjamin Hennig Measuring fine-grained multidimensional integration using mobile phone metadata: the case of Syrian refugees in Turkey Michiel Bakker, Daoud Piracha, Patricia Lu, Keis Bejgo, Mohsen Bahrami, Yan Leng, Jose Balsa-Barreiro, Julie Ricard, Alfredo Morales, Vivek Singh, Burcin Bozkaya, Selim Balcisoy and Alex Pentland Quantified Understanding of Syrian Refugee Integration in Turkey Wangsu Hu, Ran He, Jin Cao, Lisa Zhang, Huseyin Uzunalioglu, Ahmet Akyamac and Chitra Phadke 12:00 - 14:00   Session 3 (Poster) and lunch
Refugees in undeclared employment - A case study in Turkey Fabian Bruckschen, Till Koebe, Melina Ludolph, Maria Francesca Marino and Timo Schmid Mobile Data for Mobility: Travel and Communication Patterns of Syrian Refugees Eda Beyazıt, Ervin Sezgin, Kerem Arslanli and Mehmet Gencer Segregation and Sentiment: Estimating Refugee Segregation and its Effects Using Digital Trace Data Neal Marquez, Emilio Zagheni and Ingmar Weber Integration of Syrian refugees: insights from D4R, media events and housing market data Simone Bertoli, Paolo Cintia, Fosca Giannotti, Etienne Madinier, Caglar Ozden, Michael Packard, Dino Pedreschi, Hillel Rapoport, Alina Sirbu and Biagio Speciale Exploring Refugee Mobility due to Large Scale Events using Mobile Phone Records Fatima K. Abu Salem, Al-Abbas Khalil, Ahmad Dhaini, Joachim Diederich, Shady Elbassuoni and Wassim El Hajj An Overview of Group Behavior on Turkey Humberto T. M-Neto, Jussara M. Almeida, Artur Ziviani, Virgilio A. F. Almeida, Jaqueline Faria de Oliveira, Douglas C. Teixeira and Haron C. Fantecele New Approaches to the Study of Spatial Mobility and Economic Integration of Refugees in Turkey Steven Reece, Franck Duvell, Carlos Vargas-Silva and Zovanga Kone Syrian Refugee Integration in Turkey: Evidence from Call Detail Records Tugba Bozcaga, Fotini Christia, Elizabeth Harwood, Constantinos Daskalakis and Christos Papadimitriou Optimizing the Access to Healthcare Services in Dense Refugee Hosting Urban Areas: A Case for Istanbul Tarik Altuncu, Nur Sevencan and Ayse Seyyide Kaptaner Social Integration of Syrian Refugees: Some Insights from Call Detail Record Datasets Nuran Bayram-Arli, Fatih Cavdur, Mine Aydemir, Fadime Aksoy and Asli Sebatli Refugee Integration in Turkey: A Study of Mobile Phone Data Ismail Uluturk, Ismail Uysal and Onur Varol Measuring Segregation of Syrian Refugees via Mobile Call Detail Records Fatih Uludağ, Halit Eray Çelik, Serbest Ziyanak, Murat Canayaz and Fikriye Ataman Reaching all children:A data-driven allocation strategy of educational resources for Syrian refugees. Suad Aldarra, Lorenzo Lucchini, Elisa Omodei and Laura Alessandretti Developing Integration Policy for Refugees through Mobile Phone Data Analysis: A Study on Türk Telekom Customers Ibrahim Zincir, Tohid Ahmed Rana, Ayselin Yıldız and Dilaver Arıkan Açar 14:00 - 15:00   Session 4 (Oral)
Measuring and mitigating behavioural segregation as an optimisation problem: the case of Syrian refugees in Turkey Daniel Rhoads, Javier Borge-Holthoefer and Albert Solé-Ribalta Refugee Mobility: Evidence from Phone Data in Turkey Luisito Bertinelli, Rana Comertpay, Anastasia Litina, Jean-François Maystadt, Benteng Zou and Michel Beine Mobility and Calling Behavior to Assess the Integration of Syrian Refugees in Turkey Antonio Luca Alfeo, Mario Giovanni C.A. Cimino, Bruno Lepri and Gigliola Vaglini 15:00 - 16:00   Session 5 (Oral)
Characterizing the Mobile Phone Use Patterns of Refugee Hosting Provinces in Turkey Ross Gore, Meltem Y. Sener, Christine Boshuijzen-van Burken, Erika Frydenlund, Engin Bozdag and Christa de Kock Improve Education Opportunities for Better Integration of Syrian Refugees in Turkey Marco Mamei, Seyit Cilasun, Marco Lippi, Francesca Pancotto and Semih Tumen Towards an Understanding of Refugee Segregation, Isolation, Homophily and Ultimately Integration in Turkey Using Call Detail Records Jeremy Boy, David Pastor, Marguerite Nyhan, Rebeca Moreno Jimenez, Daniel Macguire and Miguel Luengo Oroz

Targeted Outcomes

The aim of the Workshop is to disseminate the findings of the D4R Challenge to a wider public. 31 research groups will present their results in the Workshop. The group meetings will bring the Challenge participants together to initiate a recommendations document (to be completed after the Workshop). These recommendations will be compiled in a jointly-authored chapter in the forthcoming book:

Salah, A.A., A. Pentland, B. Lepri, E. Letouze, P. Vinck, Y.A. de Montjoye, X. Dong (eds.), Guide to Mobile Data Analytics in Refugee Scenarios, Springer International, forthcoming.

Furthermore, a white paper in Turkish will be edited from the Challenge outcomes to be shared with the authorities.

Organization

Scientific Committee
Albert Ali Salah, Boğaziçi University
Alex Pentland, MIT
Bruno Lepri, FBK
Emmanuel Letouze, Data-Pop Alliance
Patrick Vinck, Harvard University
Yves-Alexandre de Montjoye, Imperial College London
Xiaowen Dong, University of Oxford

Project Evaluation Committee
Senem Özyavuz, Turk Telekom
Iyad Rahwan, MIT
Anahi Ayala Iacucci, Internews
Bülent Sankur, Boğaziçi University
Yıldırım Bahadırlar, TUBITAK BILGEM
Alex Rutherford, MIT
Claire Melamed, Global Partnership for Sustainable Development Data
Jean-Marie Garelli, UNHCR
Ahmad Garibeh, Istanbul & I
Geoffrey Charles Fox, Indiana University
Josephine Goube, Techfugees
Fırat Yaman Er, Turk Telekom
Phuong Pham, Harvard Humanitarian Initiative
Mithat Büyükhan, TC Ministry of Education
Mazen AboulHosn, IOM
Ömer Hakan Şimşek, TC Ministry of Health
Nona Zicherman, UNICEF
Manuel Garcia-Herranz, UNICEF
Vedran Sekara, UNICEF

Contact

Albert Ali Salah, salah@boun.edu.tr

;
Dikkatinize!

PROJE GRUPLARINCA PROJE TEKLİFLERİNİN SUNULMASI 23 Mart 2018 tarihine kadar uzatılmıştır.