Büyük Veri ve Eğitimsel Veri Madenciliğinin Eğitim Alanına Katkılarının İncelenmesi

Büyük Veri ve Eğitimsel Veri Madenciliğinin Eğitim Alanına Katkılarının İncelenmesi

Analyzing the Benefits of Big Data and Educational Data Mining on Education

Aylin TUTGUN ÜNAL
Maltepe Üniversitesi, Eğitim Fakültesi, Bilgisayar ve Öğretim Teknolojileri Eğitimi Bölümü, İstanbul aylintutgun@maltepe.edu.tr

Özet: Günlük hayatta bulunan pek çok cihaz (akıllı evler, akıllı musluklar, cep telefonları, her türlü alıcılar (sensor), robotik cihazlar, tablet bilgisayarlar, gps cihazları vs.) sayesinde dünya üzerinde algılanmayan veya veri toplama işlemine maruz kalmayan insan neredeyse kalmamış durumdadır. Özellikle internet aracılığıyla toplumun büyük bir çoğunluğu bilinçli olarak veya bilmeyerek verilerini paylaşmakta ve bu paylaşımlarının kendileri için çok ayırt edici sonuçlar ürettiğini çoğu zaman algılamamaktadır. Peki, bu kadar devasal boyutlardaki veriler nerede saklanmaktadır? İşte bu noktada “büyük veri” kavramı karşımızı çıkmaktadır. Söz konusu devasal veriler uygun teknikler ile analiz edilerek anlamlı hale getirilmekte ve bu sayede kişiler hakkında bilgiler elde edilmektedir. Eğitim amaçlı olarak verilerin toplanması, işlenmesi ve yorumlanması ve kullanılmasını içeren bu süreci “eğitimsel veri madenciliği” kavramı karşılamaktadır.
Büyük veri çeşitli alanlarda (kamu, özel sektör, eğitim, sağlık vs.) toplumun faydasına yönelik kullanılabilmektedir. Elde edilen veriler ışığında kamu sektörü toplumsal bilgi eksikliklerini tespit edebilir ve bu sayede de eğitim ihtiyaçları belirlenebilir. Diğer taraftan eğitimsel veri madenciliğine yönelik eğitim kurumlarının yapacağı ciddi planlamalar ile öğrencilerin öğrenme hızı, seviyesi, motivasyonu belirlenerek kişisel çözümler üretilebilir. Eğitimsel veri madenciliği, hesaba dayalı ve psikolojik metotlar ile öğrencinin nasıl öğrendiğini anlamak için kullanılan araştırma yaklaşımlarını içeren, yeni bir araştırma alanı olarak görülmektedir. Bu alan, çevrimiçi öğrenim sistemlerinde olduğu gibi internet üzerinden yürütülmekte olan birçok alanı etkilemekte olup, pek çok alanda araştırılmakta ve modeller (kullanıcı modelleme, etki alanı (domain) modelleme vs.) geliştirilmektedir. Bahsi geçen amaçlara ulaşmak için eğitimsel veri madenciliği araştırmacıları 5 kategoriden oluşan teknik metotları kullanmaktadırlar. Bunlar; Tahmin, kümeleme, ilişki madenciliği, insan yargılarını süzgeçten geçirme, modellerle buluş/keşfetme. Bu teknikleri kullanan eğitimsel veri madenciliği araştırmacıları, araştırmalarını yapmak için çeşitli modeller geliştirmeye devam etmektedir.
Eğitimsel veri madenciliği ülkemiz için oldukça yeni bir çalışma alanıdır ve eğitime yeni bir bakış açısı gerektirmektedir. Çünkü bu alanın eğitime uygulamalarını ve yansımalarını gözlemlemek için oldukça uzun bir sürece ihtiyaç vardır. Bu çalışmada, büyük veri ve eğitimsel veri madenciliğine bir bakış açısı oluşturularak, eğitim alanında yapılmakta olan çalışmalar incelenmiştir. Bu noktadan hareketle, eğitimsel veri madenciliği ile ilgili bir bakış açısı kazanıldığında neler yapılabileceği öneriler eşliğinde sunulmuştur.
Anahtar kelimeler: Büyük veri, veri madenciliği, eğitimsel veri madenciliği

 1.    GİRİŞ
            Günlük hayatta sıklıkla kişisel verilerimizin toplandığı gps aletleri, her türlü alıcılar (sensör), arabalar, cep telefonları, tablet bilgisayarlar, kameralar, mikrofonlar gibi pek çok araca maruz kalmaktayız. Günümüz teknolojisi sayesinde dünya üzerinde dijital olarak herhangi bir şekilde algılanmayan, herhangi bir veri toplama formatına yakalanmayan insan nerede ise kalmamış durumdadır. İnternet üzerinden herkes bilerek veya bilmeyerek verilerini paylaşmakta ve bahsi geçen verilerin kendileri için çok ayırt edici sonuçlar ürettiğini çoğu zaman algılamamaktadırlar. Dünya üzerindeki veriler 1980 den beri her 40 ayda bir ikiye katlanmakta olup, günümüzde günlük 2,5 kentilyon (2,5*1018) byte’lık veri üretimi gerçekleşmektedir (Wikipedia, 2012). Bu gün sadece Twitter 7 Terabyte, Facebook 10 Terabyte veri üretmektedir. Hatta bu veri miktarının 2020 yılında 35 zetabyte (35*1021) a çıkması beklenmektedir (Zikopoulos ve diğ., 2012).
            Veri miktarı oluşumundaki hızlı artışın temel nedeni sorgulandığında, sosyal ağ etkileşimlerinin büyüyen hacmi, lokasyon duyarlı cihazların artması ve gerçek dünya hakkında bilgi yakalayan ve ileten "akıllı sensörler"in sayısındaki artış sıralanabilir (Erkan, 2012). Söz konusu üretilen veriler tamamen işlenmemiş olduğu için ham veri olarak da ifade edilmektedir. Çünkü içerik olarak blog kayıtları, videolar, yazılım logları, email gibi yapısal olmayan veya günümüz tabiri ile herhangi bir ilişkisel veri tabanına aktarılamayan verilerdir (Dijcks, 2011).
            Bu kadar büyük ve ciddi farklılıklar içeren verilerin işlenmesi için öne sürülen Büyük Veri (Big Data) kavramı, Birleşmiş Milletler Global Pulse örgütü tarafından araştırılmış olup, Dünya Ekonomi Forumu toplantılarında tartışılmıştır. Dünya ekonomi forumunun 2011 yılında gerçekleştirilen Davos zirvesinde büyük verinin başlıca konu olarak ele alınması ve raporlarında “büyük veri büyük etki” açıklamasının yer alması da büyük verinin gücünün keşfedilmeye başlandığını ortaya koymaktadır (World Economic Forum, 2012).
            Büyük verinin ortaya koyduğu gücü açıklayan araştırmacılar, ulaşılamayan herhangi bir bakir alanın almayacağını belirtmektedir. Verilerin devasal boyutlara ulaşması sadece verilerin çok fazla aktığını göstermemekte, aynı zamanda verilerin yenilendiğini göstermektedir. Örneğin, otomobiller, elektrik sayaçları ve taşıma kasaları gibi dünya genelindeki sayısız araç, yer, hareket, vibrasyon, ısı, nem ve havadaki zehirli gazları ölçebilmekte, yer bildirebilmektedir. Diğer taraftan, Silikon vadisi olarak anılan öncelikle google daha sonra Facebook gibi mega zenginler web üzerinden arama motorları, ileti ve mesajlar vs. sayesinde topladıkları devasal verileri internet reklamcığı ile çalışır hale getirmektedir.
            Diğer taraftan, iletim sensörleri internet ile birleştiğinde zekâyı ölçebilmekte, bilgiye erişimi arttırabilmektedir. İnternet üzerindeki yazı, resim, video vs. formatındaki veriler yapısal olmayan veriler olarak adlandırılma olup klasik veri tabanlarında yapılandırılmadan anlaşılamamaktadır. Bu durumun farkında olan google gibi büyük firmalar pek çok girişimde bulunarak söz konusu verileri anlamlandırma çabalarında başlıca rol almışlardır. Amerika’da “McKinsey Global Institute” isimli bir danışmanlık firmasının araştırma birimi tarafından 2011 yılında yapılan açıklamaya göre, Amerika’nın 140.000’den 190.000’e ve daha fazla sayıda veri analizi uzmanına 1,5 milyondan fazla veri okuryazarı olan yöneticilere ihtiyacı vardır (Brown, Chui ve Manyika, 2011).
            Ekonomi, sağlık, eğitim vs. gibi pek çok alanda deneyim veya sezgilerden ziyade veriye ve analizlere dayalı kararlar alınabilmekte, bu da çok daha bilimsel olmayı gerektirmektedir. Söz konusu veriye dayalı kararlar alma işleminin günümüzdeki yansımaları sosyal medya ile oldukça net görülmektedir. Örneğin, “Match.com” isimli arkadaşlık sitesinde yer alan üyelerin kişisel özellikleri, hareketleri ve iletişimleri kadın-erkek eşleştirme algoritmasını etkilemektedir. Bir başka arkadaşlık sitesinde bunun bir örneği söz konusu algoritmaları kullanarak birbirini bulan bir çiftin hikâyesinde görülmektedir (Wired, 2014).
            Eğitim alanına baktığımızda, veri madenciliği teknikleri ile öğrenme analitiklerinin eğitim alanında kullanılmasıyla gündeme gelen eğitimsel veri madenciliği kavramı oldukça dikkat çekmektedir. Eğitim alanında yer alan öğelere (öğrenci, öğretmen, ders/kurs) yönelik yapılacak büyük veri analizleri ile eğitimde kalite artışı sağlanabilmektedir. Bununla birlikte, çevrimiçi ders yönetim sistemleriyle (Moodle gibi) birlikte uygulandığında, öğrenciler için motivasyon sağlama, başarıyı arttırma ve ihtiyaç duyduğunda iletişim kurabilme gibi pek çok işlevi yerine getirebilmektedir.
            Eğitimsel veri madenciliği tüm bu işlevleri yerine getirebilmek için hesaba dayalı ve psikolojik metotları kullanarak, öğrencinin nasıl öğrendiğini anlamak için kullanılan araştırma yaklaşımlarını da içermektedir. Bu yüzden, eğitimsel veri madenciliği yeni bir araştırma alanı olarak görülmektedir  (Bienkowski, Feng ve Means, 2012).
            Eğitimsel veri madenciliği ile ilgilenen araştırmacılar, öğrencilerin bilgi, motivasyon, üst biliş ve tutumları hakkında detaylı bilgiler edinmek ve birleştirilmiş öğrenci modelleri oluşturarak, öğrencilerin sonraki öğrenmelerini tahmin etmek; öğrenilmiş içeriği ve optimal öğretimsel sıralamaları betimleyen etki alanı (domain) modelleri keşfetmek veya geliştirmek; öğrenim yazılımı tarafından sağlanan farklı çeşitteki pedagojik desteğin etkisini çalışmak gibi pek çok amaca ulaşmak için eğitimsel veri madenciliği üzerinde çalışmalar yapmaktadır (Baker, 2011; Baker ve Yacef, 2009; Bienkowski, Feng ve Means, 2012).
            Eğitim alanında büyük veri anlayışıyla veriye yaklaşıldığında yapılacaklar oldukça müthiş görünmektedir. Fakat bununla birlikte,  yeni bir yönetim anlayışı, teknoloji uzmanları, donanımsal alt yapı vs. gibi pek çok araştırmada da bildirilen birtakım zorluklar da gündeme gelmektedir (Brown, Chui ve Manyika, 2011; Marx, 2013; McAfee ve Brynjolfsson, 2012).
            Bu çalışmada, büyük veri ve eğitimsel veri madenciliğine yönelik alanyazın incelenmiş olup, birtakım önbilgilerin oluşturulması ve eğitim alanına katkılarının incelenmesi amaçlanmıştır. 

            2. BÜYÜK VERİ
“Ölçemediğini yönetemezsin” sloganıyla bomba etkisi yaratan büyük veri, çağımızın yeni ve güçlü bir fenomeni olarak ortaya çıkmış, pek çok alanda avantajları sayesinde oldukça dikkat çekmiş ve araştırmacıların ve büyük firmaların yaptıkları çalışmalarla anlaşılmaya çalışılmakta olan yeni bir uzmanlık alanı olarak kendini göstermiştir. Büyük veri’nin kapsamı da oldukça büyük olup, alanyazında çeşitli yönleriyle ele alınmaya çalışılmıştır. Bu çalışmada ise, büyük veri’nin anlaşılmasını sağlayacak alanyazın incelenmiş, eğitim alanına katkıları ele alınmıştır. Buna göre, büyük verinin ne olduğu, özellikleri ve çeşitli alanlarda kullanımı ele alındıktan sonra eğitimde sağlayabileceği avantajlardan bahsedilmiştir.
            2.1. Büyük Veri Nedir? Özellikleri Nelerdir?
            Büyük veri diye tanımlanan veri, normal yazılım araçlarıyla makul zamanlarda işlenemeyecek ve depolanamayacak kadar büyük olan verilerdir. Yani,  geleneksel veritabanı araçları ve algoritmaları ile işlemesi zor olan bu büyük verinin oluşturulması, saklanması, akışı, analiz edilmesi gibi pek çok konuyu içeren bir terim olarak karşımıza çıkmaktadır.
            Büyük veriyi, mikroskobun modern eşdeğeri olarak tanımlayan Erik Brynjolfsson, büyük veriyi anlamak için mikroskoba bakmayı önermiştir. Bundan dört asır önce icat edilen mikroskop ile insanlar bir şeyleri hücre seviyesine kadar inerek gözlemleyebilmektedir. Ölçmede mikroskobun yarattığı devrimi ise şimdilerde büyük verinin yarattığı görülmektedir. Google aramaları, Facebook iletileri, Twitter mesajları ile mümkün olan davranışlar ölçülebilmekte, duyguların ayrıntılarına inilebilmektedir (The New York Times, 2012).
            Çağımızı “büyük veri çağı” olarak tanımlayan boyd ve Crawford (2012)’a göre, bilgisayar bilimciler, fizikçiler, ekonomistler, matematikçiler, siyaset bilimciler, biyo-enformatikçiler, sosyalist ve diğer bilimciler, insanlar, şeyler ve her ikisinin etkileşimiyle üretilen büyük miktardaki verilere erişebilmek için kıyameti koparmaktadır. Çeşitli gruplar, sosyal medya etkileşimleri, sağlık kayıtları, telefon kayıtları, hükümet kayıtları ve insanlar tarafından bırakılan diğer dijital izlerden potansiyel olarak avantaj sağlanabileceğini savunmaktadır.
             Aynı durumu oracle büyük veri için hazırlamış olduğu programı tanıtırken 3 ana başlık altında toplamaktadır. Bunlardan birincisi; “Geleneksel Kurumsal Veri” olup CRM sistemlerindeki müşteri verileri, ERP sistemlerindeki işlemsel veriler, internet sayfaları verileri, muhasebe verilerini kapsamaktadır. İkincisi; “Makine üretimi/algılayıcı verileri” olarak adlandırılmıştır ve arama detay verileri (CDR), internet sayfası logları, akıllı ölçümleyici cihaz verileri, üretim algılayıcıları, finans sistemi verilerini içine almaktadır. Üçüncüsü ise, “Sosyal Medya verileri” olup, forumlara yapılan yorumlar, twitter mesajları, facebook ve twitter paylaşımları gibi verilerdir (Dijcks, 2011).
            boyd ve Crawford (2012), büyük veriyi kültürel, teknolojik ve bilimsel bir olgu olarak tanımlamaktadır ve teknoloji, analiz ve mitolojinin karşılıklı etkileşimi vardır. Buna göre:
            Teknoloji; büyük veri setini toplarken, analiz ederken, bağlarken ve karşılaştırma yaparken hatasız bir şekilde hesaplamaları yapar ve algoritma gücünü maksimize eder.
            Analiz; büyük veri setindeki ekonomik, sosyal, teknik ve hukuki istemlerin kalıplarını belirler.
            Mitoloji; büyük veri setindeki yaygın inançları, doğruluk ve nesnelliğin doğası ile zekâ ve bilginin yüksek bir formuna sokar.
Lessing (1999), sosyal düzenin dört güç tarafından düzenlendiğini iddia etmektedir. Bunlar; market, hukuk, sosyal normlar ve mimaridir. Teknoloji durumunda ise söz konusu düzen kodlar tarafından sağlanmaktadır. Büyük verinin gündeme gelmesiyle bu düzenler daha da güçlenmiştir. Marketler büyük veriyi saf fırsat olarak görmektedir; pazarlamacılar büyük veriyi reklamcılıkta hedefe ulaşmada, sigorta sağlayıcılar tekliklerini optimize etmede kullanmaktadır. Yasalara bakıldığında, veriyi toplama ve saklama konusunda özellikle güvenlik ile ilgili önlemler önerilmiş durumdadır. Kişiselleştirme gibi özellikler ise, daha fazla ilgili bilgilere erişmeye izin vermektedir fakat etikle ilgili soruları gündeme getirmektedir (Pariser 2011). Diğer taraftan büyük veri, kanser araştırmaları, terörizm, iklim değişimi gibi alanlardaki çeşitli toplumsal sorunlara yeni anlayış potansiyeli sunan güçlü bir araç olarak görülmektedir (boyd ve Crawford, 2012).
Büyük veri ile ilgili çalışmalar giderek yaygınlaştıkça, büyük verinin ne anlama geldiği konusu giderek karmaşık bir hale gelebilmektedir. Bu noktadan hareketle, boyd ve Crawford (2012), birtakım sorular ortaya atarak büyük veriyi sorgulamaya çalışmıştır. Buna göre; büyük veri, sadece geniş bir veri setini düzenlemek ve analiz etmek için kullanılan araçlar ve prosedürleri kapsayan bir terim değildir, aynı zamanda düşünme ve araştırmada hesaba dayalı dönüşümü ifade etmektedir.
Büyük veri, araştırmalarda da radikal kaymalar yaratmıştır. Hesaba dayalı sosyal bilimler araştırmalarında yer alan açıklamalar incelendiğinde, Lazer ve diğerlerine (2009) göre, büyük veri, veri toplama ve analiz kapasitesinde benzeri görülmemiş genişlik, derinlik ve ölçülebilirlik yaratmıştır. Buna göre, bilgiye ulaşmada diğer bir ifade ile gerçek bilgiyi elde etmede bakış açısının dönüşüm gösterdiği görülmektedir. Buna örnek olarak, sosyal medya üzerinden gerçek zamanlı edinilen verilerin anlamlandırılmasıyla kişilerin davranışlarının, kişisel özelliklerinin ve hatta duygu durumlarının elde edilmesi verilebilir.
Manovich (2011), büyük veri âleminde 3 sınıf insandan söz eder: “veriyi yaratanlar” (her iki bilinçli olanlar ve dijital iz bırakanlar), “veriyi toplayanlar” ve “veriyi analiz etmede uzmanlaşanlar”. Son grubun çok az sayıda olduğu düşünüldüğünde ayrıcalıklı grup olduğu söylenebilir. Çünkü bu kişiler büyük verinin nasıl kullanılacağının ve kimlerin katılacağının kurallarını belirlemektedir.
Diğer taraftan, Russom (2011) büyük verinin 2 teknik öğenin bir araya gelmesinden oluştuğunu belirtmektedir. Birincisi, büyük miktardaki detaylandırılmış veri yığınıdır. İkincisi ise, tahmin analitikleri, veri madenciliği, istatistik, yapay zekâ, doğal dil işleme gibi teknikler üzerine kurulmuş farklı araç çeşitlerinin bir koleksiyonundan oluşmuş ileri düzeydeki analitiklerdir. Tüm bunların bir araya gelmesinden büyük veri analitikleri oluşur ve günümüzdeki yeni uygulaması BI (Business Intelligence) ile görülmektedir. Böylece işadamları, BI ile işleri ve müşterileri hakkında pek çok şey öğrenebilmektedir.
Büyük verinin geleneksel veriden en önemli farkı normal yollarla işlenememesidir. Ancak, bu veri tipinin işlenebilmesi ve doğru analiz metotları ile yorumlanması bu bilgiye ihtiyaç duyan gruplar için kritik sonuçlar çıkarabilmektedir ve özellikle şirketlerin stratejik kararlarını doğru bir biçimde almalarına, risklerini daha iyi yönetmelerine ve innovasyon yapmalarına imkân sağlayabilmektedir.  Çünkü günümüz dünyasında yapılan analizler kısıtlı bilgiler üzerinden yapılmaktadır. Bu kısıtlı bilgilere eklenecek olan analiz edilmiş incelenebilir büyük veri raporları ile beraber kurumsal şirketler, işlerine daha iyi odaklanarak verimliliklerini arttırabilirler ve bu sayede de yarış halinde oldukları rakiplerine karşı yenilikçi çözümler üreterek üst seviyelere çıkabilirler (Dijcks, 2011). Hatta büyük veri ile gelişmekte olan ülkelerin daha iyi bir noktaya gelmesi sağlanabilir (Letouzé, Tatevossian ve Kirkpatrick, 2012).
Büyük verinin özelliklerine gelince; hız, hacim, çeşitlilik olarak ilk kez 2001 yılında Doug Laney ifade etmiştir. Pek çok araştırmada 3V (Volume, Velocity, Variety) olarak ön plana çıkan özellikler, yine hacim, hız, çeşitlilik anlamlarına gelmektedir.
Russom (2011)’e göre, bahsi geçen 3V ile büyük verinin sadece verilerin fazlalığından, diğer bir ifade ile veri hacminden oluşmadığı gözler önüne serilmektedir. Aksine, Şekil 1’de görüldüğü gibi bir araya geldiklerinde kapsamlı bir tanımı ve analitiklerin ayrı bir bölümünü oluştururlar.
     Volume (hacim)                          

·   Terabyte’lar
·   Kayıtlar
·   Hareketler
·   Tablolar, dosyalar


Velocity (hız)

·  Şarj
·  Yakın zaman
·  Gerçek zaman
·  Akımlar


Variety (çeşitlilik)

·  Yapılandırılmış
·  Yapılandırılmamış
·   Yarı yapılandırılmış
·  Hepsi

Şekil 1. Büyük Verinin 3 V’si
Hacim; kapsamı oldukça geniş olup, terabyte’ları, tüm kayıtları, tabloları, dosyaları vs. içine alır. Büyük verinin faaliyet gösterdiği alana göre değişen miktarla ilgili nitelikleri ifade eder. Verinin büyüklüğü sadece terabyte’lar ile sınırlı olmayıp tüm kayıtlar verinin hacmini etkiler.
Çeşitlilik; geleneksel veri yapılarının aksine, büyük veri ciddi bir kaynak çeşitliliği göstermektedir. Örnek olarak, kayıtları, tuş akışlarını ve sosyal medyayı içeren web kaynakları verilebilir. Daha önceleri yapılandırılmış veriden söz edilirken şimdilerde yapılandırılmamış ve yarı yapılandırılmış veri setleri işe dâhil olarak bu çeşitliliği arttırmıştır.
Hız; büyük verinin veri üretme veya veri dağıtım sıklığı olarak düşünülebilmektedir. Herhangi bir aygıt veya sensörden gelen veri akışı, robotik işleyen makineler, ısıyı algılayan termometreler, video kameraların anlık veri yakalama özellikleri ile sağlanan büyük miktardaki veri akımlarıdır. McAfee ve Brynjolfsson (2012)’a göre hız veri hacminden daha önemli bir kavramdır.
           Daha sonraları farklı V’lerin, diğer bir ifade ile farklı özelliklerin de eklendiği görülmekte olup bunlardan bir tanesi değer’dir. Değer (value), geleneksel olmayan bu tarz verilerin pazarlama dünyası için yeni pazarlar bulma yolunda çok değerli olmasıyla ifade edilebilir. Bir diğeri ise verification (doğrulama)’dır. Bilgi yoğunluğu içinde verinin akışı sırasında “güvenli” olmasını ifade eden bu bileşen, akış sırasında verinin doğru katmandan, olması gerektiği güvenlik seviyesinde izlenmesi, doğru kişiler tarafından görünebilir veya gizliliğini sağlamaktadır.
 2.2. Büyük Veri Kullanımı ve Kullanılabileceği Alanlar
Büyük verinin pek çok soruna çözüm bulma, iş yaşamında verimi arttırma, eğitimde öğrenmeyi anlamlandırma ve motivasyon sağlama gibi önemli işlevlerinin olması akıllara McAfee ve Brynjolfsson (2012)’ın çalışmasında yer alan “ölçemediğini yönetemezsin” sloganını getirmektedir. Çünkü büyük verinin çözüm sunabilmesi için öncelikle büyük verinin anlaşılması ve sonra hangi aşamada kullanılması gerektiğine karar verilmesi gerekmektedir.
IBM firmasının “Büyük Veri” kavramını tanıtmak için hazırlamış olduğu kitap çalışmasında, büyük verinin kullanımına başlanmadan önce büyük veri ile ilgili bazı noktaların kabullenilmesi gerektiğini vurgulamıştır (Zikopoulos ve diğ., 2012). Bu noktalar şu şekildedir:
  • ·    Büyük veri çözümleri, sadece ham yapısal verileri işlemek için değil, çok çeşitli kaynaklardan gelen kısmi olarak yapısal olan veya hiç yapısal olmayan verileri işlemek için de kullanılmaktadır.
  • ·      Büyük veri çözümleri, sadece özet verinin işlenmesinin yeterli olmayıp tüm verinin işlenmesi gereken yerlerde ya da analiz yapmak için örnekleme çözümünün yeterli olmadığı yerlerde kullanılmaktadır.
  •       Büyük veri çözümleri, iş birimlerinin önceden belirlenemeyen ve sürekli yineleyen, araştırma gerektiren verilerinin inceleneceği yerlerde kullanılmaktadır.


Bu kabulleri özümsedikten sonra eldeki verinin işlenmesi için karşılaştırma yöntemleri kullanılarak hangi işleme yönteminin ideal olduğu belirlenmektedir. Buradaki en önemli nokta gerçekten büyük veri işleme çözümlerine ihtiyacın olup olmadığının belirlenmesidir. Mevcut yöntemler ile yapılabilen işlemlerde büyük veri işleme metotlarının kullanımları verilerin güvenilirliğinin kaybolmasına sebep olabilir. Bu veri kaybının da ortadan kaldırılması için IBM her iki yöntem ile veri analizinin kaynaştırılarak yapılmasını tavsiye etmektedir. Yani, bir çözümün her konuyu tam olarak ele alamadığı ancak ikisinin birden gerçek bir çözüm olabileceği belirtilmektedir (Zikopoulos ve diğ., 2012).
Dünya Ekonomik Forumu’nun bu seneki “Büyük Veri, Büyük Etki: Uluslararası Gelişme İçin Yeni İmkanlar” brifinginde bir çok alanda ülkelerin büyük veri analizleri yaparak gelişimlerini arttırabileceği belirtilmiş olup söz konusu alanlar Finansal Servisler, Eğitim, Sağlık ve Tarım olarak sıralanmıştır (World Economic Forum, 2012). Buna göre, eğitim alanında büyük veri analizi sayesinde, mobil cihazlarda bulunan servisler aracılığı ile elde edilen veriler ışığında kamu sektörü toplumsal bilgi eksikliklerini tespit edebilir ve bu sayede de eğitim ihtiyaçları belirlenebilir (Esgin, 2013).
            Diğer taraftan, Twitter, yüzlerce kişinin bilgisayarını ağzına kadar dolduracak veriyi her gün toplayıp, yayıp, depolamaktadır. Google, IBM, Oracle gibi büyük teknoloji firmaları ise toplanan bu ham verileri düzenlemek, temizlemek ve hepsinden önemlisi işlemenin peşindedir. Farklı sektörler bu hızlı değişime ayak uydurmaya çalışmaktadır. Örneğin, finans uzmanları hangi yatırım araçlarına ilgi olacağını anlamak için eskiden olduğu gibi sadece piyasaları, haberleri ve geçmiş verileri takip etmemektedir. Bunların yanı sıra sosyal ağlarda nelerin sıkça konuşulduğunu bilmek ve insanların nabzını tutabilmenin peşindedirler. Piyasa sinyallerini barındıran büyük veriden faydalanmak isteyenler, sadece ürünlerini satmak isteyen şirketler değildir. Devletler, sosyal ağları tarayıp, suç örgütlerini bulmak isterken, ilaç firmaları insanların Facebook durumlarını takip edip, hastalıkların dünyada nasıl yayıldığını anlamaya çalışmaktadır (Birbil, 2012).
            Büyük veri kullanımı sadece özel sektörle sınırlı olmamalıdır. Büyük veri analizi, hükümetlere kamu güvenliği, kamu sağlığı, kamu hizmetleri ve toplu taşıma gibi alanlardaki gelişimlere fırsat tanımaktadır. Bu fırsatlardan bazıları şu şekildedir (Atkinson, 2011):
·         Elektrik şirketleri, kaynakları daha iyi yönetmek ve kesintileri önlemek için akıllı metre ve veri analizlerini kullanabilir.
·         Gıda denetçileri tarladan sofraya gelen ürünlerin güvenliğini ve takibini veri kullanarak sağlayabilir.
·         Kamu sağlığı yetkilileri, bulaşıcı hastalık salgınları tespit etmek için sağlık verileri kullanabilir.
·         Regülatörler,  iyi veri analitiği ile ilaç ve tıbbi cihaz güvenliğini ve etkinliğini izleyebilir.
·         Polis departmanları, suç noktaları belirlemek ve suç dalgaları engellemek için veri analitiği kullanabilir.
·         Kamu hizmetleri, sızıntıları ve su tüketimini azaltmak için su ve kanalizasyon kullanımına ait verileri toplamak için sensörler kullanabilir.
·         Acil durumlarda vatandaşları korumak için polis ve itfaiye, sensör, kamera, GPS ve iyi iletişim sistemleri kullanabilir.
·         Ulaşımdan sorumlu devlet daireleri, trafiği azaltmak, kaynakları daha verimli dağıtmak ve ücretlendirme sistemleri uygulamak için verileri kullanabilir.
            Verilerin daha iyi kullanımı devlet kurumlarına; daha verimli, daha fazla şeffaf olma ve daha bilinçli kararlar alma yönünde yardımcı olabilir. Hükümetler; her zaman her yerde bilgiye ulaşılabilir online sistemler geliştirmek için bulut bilişim kullanabilir. Ancak, hükümet yetkilileri, veri kullanımları teşvik için daha fazla çaba göstermeleri gerekmektedir.  Büyük verinin avantajlarından yararlanabilmek için Ticaret Bakanlıkları örneğin bir veri politika ofisi oluşturarak bu işin liderliğini yapabilir. Devlet kurumları giderek bu verilerin güvenlik ve kimlik yönetimi gibi sorunları ile uğraşmak zorunda kalacak, veri analizinin başarılı kullanılması bu sorunların engel teşkil etmesini önleyebilir. Yerel yönetimler de öncü verilerin kullanımına yardımcı olabilir. Örneğin Boston yönetimi, şehirdeki çukurların nerede olduğunu, vatandaşların GPS ve ivmeölçer ile donatılmış akıllı telefonlarından gelen verilere göre otomatik belirleyen “Street Bump” mobil uygulamasına destek sağlamaktadır. Bu gibi araçlar akıllı şehirler oluşturmaya yardımcı olabilir (Atkinson, 2011)
            Birçok vatandaş veri akışını izlenmesinin, kişisel gizliliğe bir saldırı olarak görmektedir. Ancak büyük verinin ekonomiye önemli yararlar sağlayacağından şüphe duyulmamaktadır. Yapılan araştırmalar,  ABD sağlık sektörü, potansiyel değeri 300 milyar dolar olarak tahmin edilen büyük veriyi verimli ve kaliteli bir şekilde kullanabilirse, ulusal sağlık harcamalarını yüzde sekiz oranında azaltabileceğini göstermektedir. Hatta gelişmiş Avrupa ülkelerinde, devlet idareleri, büyük veri kullanarak yaklaşık 149 milyar dolar tasarruf sağlanabileceği savunulmaktadır (Manyika ve diğerleri, 2011).
            Ayrıca, büyük veri araştırma ve geliştirme girişimi ile ABD’nin bazı devlet kurumlarına daha iyi büyük veri analizi ve organizasyonu sağlamak için 200 milyon dolar’dan fazla harcama yapılacağı bildirilmiş olup, 2020 yılına kadar, profesyonel analistler büyük veriyi kullanarak kişilerin politika tercihlerini anlayabileceğini savunmaktadır (Anderson, 2012).
            Büyük veri pek çok alana katkı sağladığı gibi eğitim alanında da dikkat çeken konulardan biri olmaya başlamıştır. Gerek kamu gerekse özel sektör de olsun eğitim kurumlarında ele alındığı takdirde önemli avantajlar sağlayacağı ve eğitimde verimliliğin artabileceği söylenebilir. Bu noktadan hareketle, büyük verinin eğitim alanına yapabileceği katkılar ilgili başlık altında ele alınmıştır.
            2.3. Büyük Veri’nin Büyük Sorunları
Büyük verinin sunduğu imkânlardan faydalanmak her ne kadar kulağa hoş gelse de birtakım zorluklar gündeme gelmektedir. Alanyazın incelendiğinde, büyük veri ve eğitimsel veri madenciliğiyle ilgili zorlukları ele alan pek çok çalışmaya rastlanmaktadır (Bienkowski, Feng ve Means, 2012; Brown, Chui ve Manyika, 2011; Marx, 2013; McAfee ve Brynjolfsson, 2012; Zikopoulos ve diğ., 2012).
McAfee ve Brynjolfsson (2012), büyük veriye yönelik söz konusu zorlukları 5 kategoride ele almıştır: Liderlik, yetenek yönetimi, teknoloji, karar alma, şirket kültürü. Buna göre, şirketler kendilerine ne düşünüyoruz? sorusundan önce ne biliyoruz? sorusunu yönelterek işe başlamaları gerekmektedir. Büyük veriye geçiş yapabilmek için öncelikle eski yönetim alışkanlıklarının bırakılması gerektiğinden, bu anlayışın kazanılması oldukça zaman alacaktır ve tüm iş yapış şekillerimizde olsun düşünce tarzımızda olsun dönüşüm yaratacağına hazır olmak gerekir.
            Diğer taraftan, büyük verinin işlenmesi ve uygun analitiklerin kullanılabilmesi için gereken uzman kişilerin sayısı oldukça azdır. Amerika’da “McKinsey Global Institute” isimli bir danışmanlık firmasının araştırma birimi tarafından 2011 yılında yapılan açıklamaya göre, 2018 yılına kadar Amerika’nın 140.000’den 190.000’e ve daha fazla sayıda veri analizi uzmanına 1,5 milyondan fazla veri okuryazarı olan yöneticilere ihtiyacı vardır (Brown, Chui ve Manyika, 2011).
            Ülkemiz açısından bakıldığında, bir şirket büyük veriyi kullanmaya karar verdiğinde çalıştırmak için veri analitiği uzmanı arayacaktır ki; yetişmiş işgücü miktarı oldukça azdır. Bununla birlikte bir sorun da, büyük veriyi anlamaya ve uygulamaya çalışmanın yanı sıra, bu uzmanları yetiştirecek eğitim-öğretim kurumlarına ihtiyaç vardır.
            boyd ve Crawford (2011) ise, büyük veri kullanımındaki zorlukları şu başlıklar altında açıklamıştır: Gizlilik, veriye erişim ve paylaşımı, eşdeğer veri kullanımı, büyük ölçekli verilerdeki hatalar, sosyolojik hataların azalması ve dijital bölünme.
            Burada yer alan en önemli sorunlardan birisi gizliliktir. Verinin dünya genelinde transparanlaşması özel yaşam ve etikle ilgili sorunları da gündeme getirmektedir. Eğitim alanında uygulandığında, öğrenci ve öğretmen mahremiyetinin sağlanması ve öğrenci verilerinin bilinmesi ve işlenmesiyle bağlantılı etik sorumluluklar büyük dikkat gerektirmektedir. Diğeri ise dijital bölünme olup, verileri işleyebilen gruplar diğer gruplar üstünde bir hegamonya kurmaya çalışabilirler veya bu bilgileri onlara karşı kullanabilirler. Bu da toplumsal düzen için de tehlike yaratabilir.
            3.  BÜYÜK VERİNİN EĞİTİM ALANINA KATKILARI
Büyük verinin sunacağı olanaklardan tam olarak yararlanabilmek için yetişmiş insan gücüne ihtiyaç olduğu kesindir. Bu konuda uzman yetiştirmek için eğitim kurumlarına da iş düşmektedir. Bu durumu ciddiye alan bir yükseköğretim kurumu dışında uzman yetiştirme konusunda ülkemizde henüz bir girişim bulunmamaktadır. Bahçeşehir Üniversitesi “Büyük Veri Analitiği ve Yönetimi” isimli tezsiz yüksek lisans programı açarak, iş dünyasında "Büyük Veri", "İs Analitiği" isimleriyle de anılan, "Veri Analitiği" dalının son yıllarda tüm dünyada, özellikle Amerika'da çok önem kazanan bir bilim dalı olduğunu vurgulamıştır. Amerika’da ise, 2009 yılı öncesi bu konuda hiç yüksek lisans programı yokken, 2014 yılı itibari ile otuzu aşkın program bulunmaktadır (BAU, 2014). 
Üniversitelerde büyük veriye yönelik dersler ve programlar açıldığı taktirde, iş yapış şeklimizde ve düşünce şeklimizde dönüşümlerin gerçekleşeceği açıktır. Bu dönüşümlerin açılan bir yüksek lisans programı ile şuan başlangıç aşamasında olduğu görülmektedir. Bu aşamada, yetiştirilecek veri analitiği uzmanları ile ileride işgücünün artacağı düşünülebilir.
Diğer taraftan, eğitimde büyük veri kullanımına yönelik başka bir ilgi alanı ise,  sosyal medya kullanıcısı öğrenciler hakkında kayıt toplayarak öğrenciler hakkında bilgi sahibi olmaktır. 2006 yılında, Harvard’daki bir araştırma grubu tarafından 1700 kolej öğrencisinin facebook profilleri toplanmış, ilgi alanları ve arkadaşlık bilgilerinin zaman içinde nasıl değiştiğini incelemişlerdir (Lewis ve diğ., 2008).
Büyük verinin üniversitelere güç kazandırarak zenginlik sağlayacağını fark eden üst sınıf, iyi-kaynağa sahip üniversiteler, verilere erişebilecek ve üst sınıf üniversitelerdeki öğrenciler büyük olasılıkla büyük sosyal medya şirketleri içinde çalışmaya davet edilecektir. Diğer çevredekiler ise, bu davetiyeleri alma olasılığı daha az olacağından, becerilerini geliştiremeyeceklerdir. Sonuç olarak, bilim adamları arasında bölünmeler başlayacaktır (boyd ve Crawford, 2012). Hal böyle olsa da, büyük veriden yararlanan üniversitelerin hem kendilerine zenginlik kazandırdığı hem de öğrencilerine iyi firmalarda iş imkânları sağladıkları açıktır.
            Büyük veriyi kullanan birtakım büyük şirketler, üyelerinin ilgi alanlarını tespit ederek sonraki ziyaretlerinde onlara yönelik öneriler sunmaktadır. Örneğin, Amazon, kişilerin satın alma geçmişlerine ait bilgiye dayalı olarak yüksek düzeyde kişiselleştirilmiş öneriler oluşturan bir sisteme sahiptir. Yiu (2012)’ya göre, devletler de bu tip sistemler kullanarak vatandaşları için kişileştirilmiş hizmetler sunabilir. Bu sistem eğitim alanına entegre edildiği taktirde, bir çevrimiçi kurs sistemi ile kişiye özel eğitimin de gerçekleştirilebilmesi mümkündür. Bu sayede, her bir öğrenciye özelliği dâhilinde eğitim sunulabilir, öğrencilere ait kayıtlar tutularak sonraki öğrenmeleri tahmin edilebilir. Diğer bir açıdan bakıldığında, öğretmenler veya kurum yöneticileri de öğrenciler hakkında veya yöneticiler öğretmenler hakkında kişisel olsun duygu durumsal olsun her türlü bilgiye erişebilecektir.
            4. EĞİTİMSEL VERİ MADENCİLİĞİ VE EĞİTİM ALANINA KATKILARI
            Veri madenciliği ve veri analitikleri, araç ve teknikleri daha önceleri araştırma laboratuarları ile sınırlı iken, günümüzde ileri görüşlü endüstriler, karar verme mekanizmalarında ve bu bağlamda,  işlerini geliştirmede bu tekniklerden güç sağlamaktadırlar. Yüksek Eğitim Enstitüleri, sağladıkları servisleri geliştirmek ve öğrencilerin mezuniyeti ile devamlılığını arttırmak için bu analitiklerden yararlanmaya başlamıştır. Amerika Eğitim Departmanının Ulusal Eğitim Teknolojileri Planı, kendine özgü bir modele sahip olup, 21. Yüzyılın teknolojiyle güçlendirilmiş öğreniminde, çevrimiçi öğrenim sistemlerinden öğretimi güçlendirecek verileri kullanmanın yollarını göz önünde bulundurmaktadır (Bienkowski, Feng ve Means, 2012).
            Eğitimsel veri madenciliği, hesaba dayalı ve psikolojik metotlar ile öğrencinin nasıl öğrendiğini anlamak için kullanılan araştırma yaklaşımlarını içeren, yeni bir araştırma alanı olarak görülmektedir. Bu alan, çevrimiçi öğrenim sistemlerini de etkileyen birçok alanda araştırılmakta ve modeller geliştirilmektedir. Kullanıcı modelleme, bu alanlardan bir tanesi olup, öğrencinin ne bildiğini, davranış ve motivasyonunu, deneyimlerini ve çevrimiçi öğrenmede nasıl memnun olduğunu kapsamaktadır. Bu bağlamda, basit seviyedeki analitikler, öğrenci çevrimiçi kurstayken, hata yaptığında ya da ilgisi dağıldığında onu tespit ederek derse döndürebilmektedir. Daha karmaşığı, öğrencinin tuş tıklamalarından model oluşturarak sıkıldığını tespit ederek, öğrencinin dikkatini tekrar derse döndürmektir. Tüm bunlar, verilerin gerçek zamanlı olarak toplanıp, işlenebilmesinden dolayı mümkün olabilmekte, farklı zaman ölçeklerinde çalıştırılan çoklu geribildirim döngüleri ile devamlılığı sağlanmaktadır (Bienkowski, Feng ve Means, 2012).
            Diğer taraftan, kullanıcı ya da öğrenci modellerine bildirilen benzer türdeki veriler kullanıcı profilleri oluşturmada kullanılabilmektedir. Buradaki profil oluşturma, genel olarak benzer özellikteki kullanıcıları belirgin özellikler kullanılarak kategorilere ayırma anlamındadır. Daha sonra bu kategoriler, gruptaki kullanıcılara alıştırma sunarken, tavsiyelerde bulunurken ve sistemdeki performansının nasıl olduğu ile ilgili bilgi verirken kullanılabilmektedir.
            Kullanıcı modelleme ve profilleme, gerçek zamanlı adaptasyonlarda/sistemlerde anlamlı görülmektedir. Aksine, bazı veri madenciliği ve analitiği uygulamaları daha deneysel amaçlıdır. Örneğin, etki alanı (domain) modelleme, bir konunun nasıl sunulacağını ve detayların seviyesini anlama amaçlı kullanılmakta olup, büyük ölçüde deneyseldir. Öğrenme bileşenleri ve öğretimsel prensiplere yönelik çalışmalar da, öğrenimi geliştirmede neyin etkili olduğunu anlamak için deneyleri kullanmaktadır. Bu noktadan hareketle, veri madenciliğinde kullanılan teknik ve metotların, genel öğrenme prensipleri ve yaklaşımlarını desteklediğini söyleyebiliriz.
            İlk ve orta dereceli okullar ve okul bölgeleri, öğretimsel gelişim, güvenlik ve ölçme sonuçlarından yola çıkarak alanları belirleyebilmek için birtakım enstitü seviyesinde analizleri kullanmaya başlamıştır. Öğrencilerin öğrenimini ve değerlendirme aktivitelerini görünür yapmak, öğrencilerin kendi öğrenmelerini izlemelerini ve doğrudan kendi çabalarının başarılarını nasıl arttırdığını görebilmelerini mümkün kılarak, onların seviyelerini geliştirmektedir. Öğretmenler öğrencilerin performansı hakkında bilgi sahibi olabilmekte ve bu bağlamda, öğretim içeriklerini ve değerlendirmelerini öğrencilere uygun hale getirebilmektedir.
            Eğitimsel verinin bir önemli ve değerli özelliği hiyerarşik olmasıdır. Veriler, tuş vuruşu seviyesi, cevap seviyesi, oturum seviyesi, öğrenci seviyesi, sınıf seviyesi, öğretmen seviyesi ve okul seviyesi şeklinde katmanlardan oluşmakta olup, her biri birbiri içine geçmektedir (Baker, 2011; Romero ve Ventura, 2010). Diğer önemli özelliği ise, zaman, dizi ve içeriktir. Zamanlama, öğrenme anında ya da pratik yapma oturumu süresince veriyi yakalamak için önemlidir. Dizi, birbirini izleyen içeriklerin nasıl oluşturulacağını ve öğretim ve alıştırmaların nasıl sıralanacağını yansıtmaktadır. İçerik, bir modelin nerede çalıp çalışmadığını bilmek ve sonuçları açıklamak için önemlidir. Hiyerarşik veri madenciliği için metotlar ve boylamsal veri modelleme, eğitimsel veri madenciliğinde önemli geliştiriciler olarak görülmektedir.
            Eğitimsel veri madenciliği ile ilgilenen araştırmacıların (Baker, 2011; Baker ve Yacef, 2009) araştırmalarında birtakım amaçlar ön planda olup, bu amaçlardan bazıları şu şekildedir: Öğrencilerin bilgi, motivasyon, üst biliş ve tutumları hakkında detaylı bilgiler edinmek ve birleştirilmiş öğrenci modelleri oluşturarak, öğrencilerin sonraki öğrenmelerini tahmin etmek; Öğrenilmiş içeriği ve optimal öğretimsel sıralamaları betimleyen etki alanı (domain) modelleri keşfetmek veya geliştirmek; öğrenim yazılımı tarafından sağlanan farklı çeşitteki pedagojik desteğin etkisini çalışmak; öğrenciyi, etki alanını ve yazılımsal pedagojiyi birleştiren modeller olarak hesaba dayalı modeller oluşturarak öğrenim ve öğrenci hakkında bilimsel bilgiyi geliştirmek.
            Bahsi geçen amaçlara ulaşmak için eğitimsel veri madenciliği araştırmacıları 5 kategoriden oluşan teknik metotları kullanmaktadırlar (Baker, 2011). Bunlar; Tahmin, kümeleme, ilişki madenciliği, insan yargılarını süzgeçten geçirme, modellerle buluş/keşfetme. Bu teknikleri kullanan eğitimsel veri madenciliği araştırmacıları, araştırmalarını yapmak için çeşitli modeller geliştirmektedirler.
            Çevrimiçi öğrenim sistemleri, akıllı öğretim sistemlerini, sanal laboratuarları veya simülasyonları kullanan etkileşimli öğrenim ortamları olarak ifade edilebilir (Bienkowski, Feng ve Means, 2012). Çevrimiçi dersler, bir kurs yönetim sistemi (Moodle, Sakai vs.) veya bir öğrenim platformu ile sunulabilmektedir. Büyük veri ile bahsi geçen öğrenim yönetim sistemlerindeki öğrencilerden bilgi toplanarak, bir sonraki ders ya da kurs, onların özelliklerine göre hazırlanabilmektedir. Bienkowski, Feng ve Means (2012)’ye göre, öğrenci çevrimiçi ortamda öğrenirken, teknolojinin gücünden yararlanarak bir ön değerlendirme yapmak için birçok avantaj vardır. Buna göre, bir çevrimiçi sistem, manuel metotlara göre, öğrencinin nasıl öğrendiğine dair çok daha fazla detaylı bilgiyi toplayabilmektedir. Öğrenci çalışırken, sistem onların girdilerini yakalayabilir ve onların problem çözme adımlarından, bilgi ve strateji kullanımlarından kanıt toplayabilir (U.S. Department of Education, 2010, p.35). Dahası, belirli bir öğrencinin bir sonraki ders içeriğinde, önemli değerlendirme sınavları da dâhil olmak üzere, nasıl bir performans göstereceğini tahmin edebilir. Bu noktadan hareketle, veri-zengini sistemler, öğrencilere, eğitimcilere ve yöneticilere, bilgilendirici ve işlenebilir geribildirimler sağlayabilmektedir.
            Eğitimsel veri madenciliği ve öğrenme analitik teknikleri maliyet ve birtakım zorluklardan etkilenmektedir. Algoritma geliştiricileri bu teknikleri gerektiren hesaba dayalı maliyetlerin farkına varmaya çalışırken, Bilgi Teknolojileri Departmanları, yüklü verileri toplama ve depolamaya bağlı maliyetleri anlamaya çalışmaktalar. Diğer teknik zorluk, eğitimsel veri sistemlerin, birlikte çalışabilir olmayışıdır. Bu bağlamda, yönetilebilir verinin ve sınıf seviyesindeki verinin bir araya getirilmesi zorluğu artmaktadır. Diğer taraftan, öğrenci ve öğretmen mahremiyetinin sağlanması ve öğrenci verilerinin bilinmesi ile işlenmesiyle bağlantılı etik sorumluluklar büyük dikkat gerektirmektedir.
            5. SONUÇ
Bu çalışmada, büyük veri ve eğitimsel veri madenciliği çalışmaları ile eğitim alanına katkıları incelenmiştir. Günümüz teknolojisinin getirilerinden olan büyük veri ve eğitimsel veri madenciliği çalışmalarının pek çok alana önemli katkılar sağlayacağı açıkça görülmektedir. Şuan büyük veri ve özellikle eğitimsel veri madenciliği alanlarının oldukça yeni olması, öncelikle bu alanların tanımlanması ve kavranması ile ilgili çalışmaları gerekli kılmaktadır ki; yeterli anlayış kazanıldığında yapılacakların önüne geçilmesi imkânsız olacaktır.
Büyük veri, özel sektör, kamu ve birey bazında düşünüldüğünde herkesin avantajlarından yararlanabileceği bir alandır.     
           
KAYNAKÇA
Anderson,J, Q. (2012). Big Data: Experts say new forms of information   analysis will help people be more nimble and adaptive, but worry over humans’ capacity to understand and use these new tools. http://pewinternet.org/~/media/Files/Reports/2012/PIP_Future_of_Internet_2012_Big_Data.pdf, Erişim: 18 Aralık 2012.
Atkinson, R.(2011). Government Opportunities to Harness “Big Data”. Information Technology and Innovation Foundation (ITIF), http://www.innovationfiles.org/government-opportunities-to-harness-%E2%80%9Cbig-data%E2%80%9D/ web adresinden 26 Aralık 2012 tarihinde edinilmiştir.
Baker, R.S. J. d. (2011). Data Mining for Education, International Encyclopedia of Education, 3rd ed., edited by B. McGaw, p. Peterson and E. Baker, Oxford, UK: Elsevier.
Baker, R.S. J. d. & Yacef, K. (2009). The State of Educational Data Mining in 2009: A Review and Future Visions, Journal of Educational Data Mining, 1(1): 3-17.
BAU (2014). Bahçeşehir Üniversitesi Yüksek Lisans & Doktora. Büyük Veri Analitiği ve Yönetimi (Big Data). http://www.bahcesehir.edu.tr/icerik/7502-veri-analitigi-ve-yonetimi# web adresinden 2 Eylül 2014 tarihinde edinilmiştir.
Bienkowski, M., Feng, M. & Means, B. (2012). Enhancing Teaching and Learning Through Educational Data Mining and Learning Analytics-An Issue Brief, http://tech.ed.gov/learning-analytics/ web adresinden 10 Aralık 2013 tarihinde edinilmiştir.
Birbil, İ. (2012).Tam Gaz Büyüyen Dev: Big Data. Radikal Gazetesi, 20.10.2012.
boyd, D. & Crawford, K. (2012). Critical Questions For Big Data, Information, Communication & Society, 15:5, 662-679.
Brown, B., Chui, M. & Manyika, J. (2011). Are You Ready for the Era of ‘Big Data’? McKinsey Global Institute, http://www.t-systems.com/solutions/download-mckinsey-quarterly-/1148544_1/blobBinary/Study-McKinsey-Big-data.pdf web adresinden 20 Aralık 2013 tarihinde edinilmiştir.
Dijcks, J.-P. (2011). Oracle: Big Data for the Enterprise. California: Oracle.
Erkan, S. (2012). Büyük Veri - Big Data Nedir? Uygulamalar ve Fırsatlar [Yönetici Özeti], http://www.karel.com.tr/blog/buyuk-veri-big-data-nedir-uygulamalar-ve-firsatlar-yonetici-ozeti web adresinden 2 Eylül 2014 tarihinde edinilmiştir.
Esgin, M. S. (2013). Fırsatlar ve Tehditler Boyutlarıyla Veri Yönetimi Alanının Yeni Oyuncusu Olarak Büyük Veri. Yazılım Akademisi 2013, http://www.yazilimakademisi.org/ web adresinden 12 Eylül 2014 tarihinde edinilmiştir.
Lazer, D., Pentland, A., Adamic, L., Aral, S., Baraba´si, A., Brewer, D., Christakis, N., Contractor, N., Fowler, J., Gutmann, M., Jebara, T., King, G., Macy, M.,Roy, D. & Van Alstyne, M. (2009). Computational social science, Science, vol.323, no. 5915, pp. 721–723.
Lessig, L. (1999). Code: and Other Laws of Cyberspace, Basic Books, New York, NY.
Letouzé, E., Tatevossian, A. & Kirkpatrick, R. (2012). Big Data for Development: Challenges & Opportunities. New York: UN Global Pulse.
Lewis, K., Kaufman, J., Gonzalez, M., Wimmer, A. & Christakis, N. (2008).‘Tastes, ties, and time: a new social network dataset using Facebook.com’, Social Networks, vol. 30, no. 4, pp. 330–342.
Manovich, L. (2011). Trending: the promises and the challenges of big social data, in Debates in the Digital Humanities, ed. M. K. Gold, The University of Minnesota Press, Minneapolis, MN, http://www.manovich.net/DOCS/Manovich_trending_paper.pdf  web adresinden 15 Temmuz 2013 tarihinde edinilmiştir.
Manyika,J., Chui, M.,Brown,B., Bughin,J., Dobbs,R., Roxburgh,C. & Byers,A.H.(2011).Big Data:The Next Frontier for Innovation, Competition, and Productivity. McKinsey Global Institute, http://www.mckinsey.com/Insights/MGI/Research/Technology_and_Innovation/Big_data_The_next_frontier_for_innovation web adresinden 17 Aralık 2012 tarihinde edinilmiştir.
Marx, V. (2013). The Big Challenges of Big Data. Nature, v.498, 255-60.
McAfee, A. & Brynjolfsson, E. (2012). Big Data: The Management Revolution. Harvard Business Review, http://hbr.org/2012/10/big-data-the-management-revolution/ar web adresinden 5 Eylül 2014 tarihinde edinilmiştir.
Pariser, E. (2011). The Filter Bubble: What the Internet is Hiding from You, Penguin Press, New York.
Romero, C.R. & Ventura, S. (2010). Educational Data Mining: A Review of the State of the Art, IEEE Transactions on Systems, Man and Cybernetics, Part C: Applications and Reviews, 40(6): 601-618.
Russom, P. (2011). Big Data Analytics. TDWI Best Practice Report, TDWI (The Data Warehousing InstituteTM).
The New Yok Times (2012). The Age of Bigdata. http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the-world.html?_r=0 web adresinden 28 Ağustos 2014 tarihinde edinilmiştir.
U.S. Department of Education (2010). National Education Technology Plan. http://www.ed.gov/technology/netp-2010 Erişim: 5 Aralık 2012.
Yiu, C.  (2012). The Big Data Opportunity Making government faster, smarter and more personal. http://www.policyexchange.org.uk/images/publications/the%20big%20data%20opportunity.pdf web adresinden 11 Aralık 2012 tarihinde edinilmiştir.
Wikipedia. (2012, December 09). Big Data. Retrieved from Wikipedia, the free encyclopedia: http://en.wikipedia.org/wiki/Big_data web adresinden 10 Eylül 2014 tarihinde edinilmiştir.
Wired (2014). How a Math Genius Hacked OkCupid to Find True Love, Wired Magazine, http://www.wired.com/2014/01/how-to-hack-okcupid/ web adresinden 1 Eylül 2014 tarihinde edinilmiştir.
World Economic Forum. (2012). Big Data, Big Impact: New Possibilities for International Development. Geneva: World Economic Forum.

Zikopoulos, P., Eaton, C., Redoos, D., Deutsch, T., & Lapis, G. (2012). Understanding Big Data. Newyork: Mc Grawhill.

Cite: 
·  Tutgun-Ünal, A. (2014). Büyük Veri ve Eğitimsel Veri Madenciliğinin Eğitim Alanına Katkılarının İncelenmesi. 8. Uluslararası Bilgisayar ve Öğretim Teknolojileri Sempozyumu, Edirne. 

Hiç yorum yok:

Yorum Gönder