Büyük
Veri ve Eğitimsel Veri Madenciliğinin Eğitim Alanına Katkılarının İncelenmesi
Analyzing the Benefits of Big Data and
Educational Data Mining on Education
Aylin
TUTGUN ÜNAL
Maltepe Üniversitesi, Eğitim Fakültesi,
Bilgisayar ve Öğretim Teknolojileri Eğitimi Bölümü, İstanbul aylintutgun@maltepe.edu.tr
Özet: Günlük hayatta bulunan pek çok
cihaz (akıllı evler, akıllı musluklar, cep telefonları, her türlü alıcılar
(sensor), robotik cihazlar, tablet bilgisayarlar, gps cihazları vs.) sayesinde
dünya üzerinde algılanmayan veya veri toplama işlemine maruz kalmayan insan
neredeyse kalmamış durumdadır. Özellikle internet aracılığıyla toplumun büyük
bir çoğunluğu bilinçli olarak veya bilmeyerek verilerini paylaşmakta ve bu
paylaşımlarının kendileri için çok ayırt edici sonuçlar ürettiğini çoğu zaman
algılamamaktadır. Peki, bu kadar devasal boyutlardaki veriler nerede
saklanmaktadır? İşte bu noktada “büyük veri” kavramı karşımızı çıkmaktadır. Söz
konusu devasal veriler uygun teknikler ile analiz edilerek anlamlı hale
getirilmekte ve bu sayede kişiler hakkında bilgiler elde edilmektedir. Eğitim
amaçlı olarak verilerin toplanması, işlenmesi ve yorumlanması ve kullanılmasını
içeren bu süreci “eğitimsel veri madenciliği” kavramı karşılamaktadır.
Büyük
veri çeşitli alanlarda (kamu, özel sektör, eğitim, sağlık vs.) toplumun
faydasına yönelik kullanılabilmektedir. Elde edilen veriler ışığında kamu
sektörü toplumsal bilgi eksikliklerini tespit edebilir ve bu sayede de eğitim
ihtiyaçları belirlenebilir. Diğer taraftan eğitimsel veri madenciliğine yönelik
eğitim kurumlarının yapacağı ciddi planlamalar ile öğrencilerin öğrenme hızı,
seviyesi, motivasyonu belirlenerek kişisel çözümler üretilebilir. Eğitimsel
veri madenciliği, hesaba dayalı ve psikolojik metotlar ile öğrencinin nasıl
öğrendiğini anlamak için kullanılan araştırma yaklaşımlarını içeren, yeni bir
araştırma alanı olarak görülmektedir. Bu alan, çevrimiçi öğrenim sistemlerinde
olduğu gibi internet üzerinden yürütülmekte olan birçok alanı etkilemekte olup,
pek çok alanda araştırılmakta ve modeller (kullanıcı modelleme, etki alanı
(domain) modelleme vs.) geliştirilmektedir. Bahsi geçen amaçlara ulaşmak için
eğitimsel veri madenciliği araştırmacıları 5 kategoriden oluşan teknik
metotları kullanmaktadırlar. Bunlar; Tahmin, kümeleme, ilişki madenciliği,
insan yargılarını süzgeçten geçirme, modellerle buluş/keşfetme. Bu teknikleri
kullanan eğitimsel veri madenciliği araştırmacıları, araştırmalarını yapmak
için çeşitli modeller geliştirmeye devam etmektedir.
Eğitimsel
veri madenciliği ülkemiz için oldukça yeni bir çalışma alanıdır ve eğitime yeni
bir bakış açısı gerektirmektedir. Çünkü bu alanın eğitime uygulamalarını ve
yansımalarını gözlemlemek için oldukça uzun bir sürece ihtiyaç vardır. Bu
çalışmada, büyük veri ve eğitimsel veri madenciliğine bir bakış açısı
oluşturularak, eğitim alanında yapılmakta olan çalışmalar incelenmiştir. Bu
noktadan hareketle, eğitimsel veri madenciliği ile ilgili bir bakış açısı
kazanıldığında neler yapılabileceği öneriler eşliğinde sunulmuştur.
Anahtar kelimeler: Büyük veri, veri madenciliği,
eğitimsel veri madenciliği
1. GİRİŞ
Günlük hayatta sıklıkla kişisel
verilerimizin toplandığı gps aletleri, her türlü alıcılar (sensör), arabalar,
cep telefonları, tablet bilgisayarlar, kameralar, mikrofonlar gibi pek çok
araca maruz kalmaktayız. Günümüz teknolojisi sayesinde dünya üzerinde dijital
olarak herhangi bir şekilde algılanmayan, herhangi bir veri toplama formatına
yakalanmayan insan nerede ise kalmamış durumdadır. İnternet üzerinden herkes
bilerek veya bilmeyerek verilerini paylaşmakta ve bahsi geçen verilerin
kendileri için çok ayırt edici sonuçlar ürettiğini çoğu zaman
algılamamaktadırlar. Dünya üzerindeki veriler 1980 den beri her 40 ayda bir
ikiye katlanmakta olup, günümüzde günlük 2,5 kentilyon (2,5*1018)
byte’lık veri üretimi gerçekleşmektedir
(Wikipedia, 2012). Bu gün sadece Twitter 7 Terabyte, Facebook 10
Terabyte veri üretmektedir. Hatta bu veri miktarının 2020 yılında 35 zetabyte
(35*1021) a çıkması beklenmektedir
(Zikopoulos ve diğ., 2012).
Veri miktarı oluşumundaki hızlı
artışın temel nedeni sorgulandığında, sosyal ağ etkileşimlerinin büyüyen hacmi,
lokasyon duyarlı cihazların artması ve gerçek dünya hakkında bilgi yakalayan ve
ileten "akıllı sensörler"in sayısındaki artış sıralanabilir (Erkan,
2012). Söz konusu üretilen veriler tamamen işlenmemiş olduğu için ham veri olarak
da ifade edilmektedir. Çünkü içerik olarak blog kayıtları, videolar, yazılım
logları, email gibi yapısal olmayan veya günümüz tabiri ile herhangi bir
ilişkisel veri tabanına aktarılamayan verilerdir
(Dijcks, 2011).
Bu kadar büyük ve ciddi farklılıklar
içeren verilerin işlenmesi için öne sürülen Büyük Veri (Big Data) kavramı,
Birleşmiş Milletler Global Pulse örgütü tarafından araştırılmış olup, Dünya
Ekonomi Forumu toplantılarında tartışılmıştır. Dünya ekonomi forumunun 2011
yılında gerçekleştirilen Davos zirvesinde büyük verinin başlıca konu olarak ele
alınması ve raporlarında “büyük veri büyük etki” açıklamasının yer alması da
büyük verinin gücünün keşfedilmeye başlandığını ortaya koymaktadır (World Economic Forum,
2012).
Büyük verinin ortaya koyduğu gücü
açıklayan araştırmacılar, ulaşılamayan herhangi bir bakir alanın almayacağını
belirtmektedir. Verilerin devasal boyutlara ulaşması sadece verilerin çok fazla
aktığını göstermemekte, aynı zamanda verilerin yenilendiğini göstermektedir.
Örneğin, otomobiller, elektrik sayaçları ve taşıma kasaları gibi dünya
genelindeki sayısız araç, yer, hareket, vibrasyon, ısı, nem ve havadaki zehirli
gazları ölçebilmekte, yer bildirebilmektedir. Diğer taraftan, Silikon vadisi
olarak anılan öncelikle google daha sonra Facebook gibi mega zenginler web
üzerinden arama motorları, ileti ve mesajlar vs. sayesinde topladıkları devasal
verileri internet reklamcığı ile çalışır hale getirmektedir.
Diğer taraftan, iletim sensörleri
internet ile birleştiğinde zekâyı ölçebilmekte, bilgiye erişimi
arttırabilmektedir. İnternet üzerindeki yazı, resim, video vs. formatındaki
veriler yapısal olmayan veriler olarak adlandırılma olup klasik veri
tabanlarında yapılandırılmadan anlaşılamamaktadır. Bu durumun farkında olan
google gibi büyük firmalar pek çok girişimde bulunarak söz konusu verileri
anlamlandırma çabalarında başlıca rol almışlardır. Amerika’da “McKinsey Global
Institute” isimli bir danışmanlık firmasının araştırma birimi tarafından 2011
yılında yapılan açıklamaya göre, Amerika’nın 140.000’den 190.000’e ve daha
fazla sayıda veri analizi uzmanına 1,5 milyondan fazla veri okuryazarı olan
yöneticilere ihtiyacı vardır (Brown, Chui ve Manyika, 2011).
Ekonomi, sağlık, eğitim vs. gibi pek
çok alanda deneyim veya sezgilerden ziyade veriye ve analizlere dayalı kararlar
alınabilmekte, bu da çok daha bilimsel olmayı gerektirmektedir. Söz konusu
veriye dayalı kararlar alma işleminin günümüzdeki yansımaları sosyal medya ile
oldukça net görülmektedir. Örneğin, “Match.com” isimli arkadaşlık sitesinde yer
alan üyelerin kişisel özellikleri, hareketleri ve iletişimleri kadın-erkek
eşleştirme algoritmasını etkilemektedir. Bir başka arkadaşlık sitesinde bunun
bir örneği söz konusu algoritmaları kullanarak birbirini bulan bir çiftin hikâyesinde
görülmektedir (Wired, 2014).
Eğitim alanına baktığımızda, veri
madenciliği teknikleri ile öğrenme analitiklerinin eğitim alanında
kullanılmasıyla gündeme gelen eğitimsel veri madenciliği kavramı oldukça dikkat
çekmektedir. Eğitim alanında yer alan öğelere (öğrenci, öğretmen, ders/kurs) yönelik
yapılacak büyük veri analizleri ile eğitimde kalite artışı sağlanabilmektedir.
Bununla birlikte, çevrimiçi ders yönetim sistemleriyle (Moodle gibi) birlikte
uygulandığında, öğrenciler için motivasyon sağlama, başarıyı arttırma ve
ihtiyaç duyduğunda iletişim kurabilme gibi pek çok işlevi yerine
getirebilmektedir.
Eğitimsel veri madenciliği tüm bu
işlevleri yerine getirebilmek için hesaba dayalı ve psikolojik metotları
kullanarak, öğrencinin nasıl öğrendiğini anlamak için kullanılan araştırma
yaklaşımlarını da içermektedir. Bu yüzden, eğitimsel veri madenciliği yeni bir
araştırma alanı olarak görülmektedir (Bienkowski, Feng ve Means, 2012).
Eğitimsel veri madenciliği ile
ilgilenen araştırmacılar, öğrencilerin bilgi, motivasyon, üst biliş ve
tutumları hakkında detaylı bilgiler edinmek ve birleştirilmiş öğrenci modelleri
oluşturarak, öğrencilerin sonraki öğrenmelerini tahmin etmek; öğrenilmiş içeriği
ve optimal öğretimsel sıralamaları betimleyen etki alanı (domain) modelleri
keşfetmek veya geliştirmek; öğrenim yazılımı tarafından sağlanan farklı
çeşitteki pedagojik desteğin etkisini çalışmak gibi pek çok amaca ulaşmak için
eğitimsel veri madenciliği üzerinde çalışmalar yapmaktadır (Baker, 2011; Baker
ve Yacef, 2009; Bienkowski, Feng ve Means, 2012).
Eğitim alanında büyük veri
anlayışıyla veriye yaklaşıldığında yapılacaklar oldukça müthiş görünmektedir.
Fakat bununla birlikte, yeni bir yönetim
anlayışı, teknoloji uzmanları, donanımsal alt yapı vs. gibi pek çok araştırmada
da bildirilen birtakım zorluklar da gündeme gelmektedir (Brown, Chui ve Manyika,
2011; Marx, 2013; McAfee ve Brynjolfsson, 2012).
Bu çalışmada, büyük veri ve
eğitimsel veri madenciliğine yönelik alanyazın incelenmiş olup, birtakım
önbilgilerin oluşturulması ve eğitim alanına katkılarının incelenmesi
amaçlanmıştır.
2. BÜYÜK VERİ
“Ölçemediğini
yönetemezsin” sloganıyla bomba etkisi yaratan büyük veri, çağımızın yeni ve
güçlü bir fenomeni olarak ortaya çıkmış, pek çok alanda avantajları sayesinde
oldukça dikkat çekmiş ve araştırmacıların ve büyük firmaların yaptıkları
çalışmalarla anlaşılmaya çalışılmakta olan yeni bir uzmanlık alanı olarak
kendini göstermiştir. Büyük veri’nin kapsamı da oldukça büyük olup, alanyazında
çeşitli yönleriyle ele alınmaya çalışılmıştır. Bu çalışmada ise, büyük veri’nin
anlaşılmasını sağlayacak alanyazın incelenmiş, eğitim alanına katkıları ele
alınmıştır. Buna göre, büyük verinin ne olduğu, özellikleri ve çeşitli
alanlarda kullanımı ele alındıktan sonra eğitimde sağlayabileceği avantajlardan
bahsedilmiştir.
2.1. Büyük Veri Nedir? Özellikleri
Nelerdir?
Büyük veri diye tanımlanan veri,
normal yazılım araçlarıyla makul zamanlarda işlenemeyecek ve depolanamayacak
kadar büyük olan verilerdir. Yani,
geleneksel veritabanı araçları ve algoritmaları ile işlemesi zor olan bu
büyük verinin oluşturulması, saklanması, akışı, analiz edilmesi gibi pek çok
konuyu içeren bir terim olarak karşımıza çıkmaktadır.
Büyük veriyi, mikroskobun modern
eşdeğeri olarak tanımlayan Erik Brynjolfsson, büyük veriyi anlamak için
mikroskoba bakmayı önermiştir. Bundan dört asır önce icat edilen mikroskop ile
insanlar bir şeyleri hücre seviyesine kadar inerek gözlemleyebilmektedir. Ölçmede
mikroskobun yarattığı devrimi ise şimdilerde büyük verinin yarattığı
görülmektedir. Google aramaları, Facebook iletileri, Twitter mesajları ile
mümkün olan davranışlar ölçülebilmekte, duyguların ayrıntılarına
inilebilmektedir (The New York Times, 2012).
Çağımızı “büyük veri çağı” olarak
tanımlayan boyd ve Crawford (2012)’a göre, bilgisayar bilimciler, fizikçiler,
ekonomistler, matematikçiler, siyaset bilimciler, biyo-enformatikçiler,
sosyalist ve diğer bilimciler, insanlar, şeyler ve her ikisinin etkileşimiyle
üretilen büyük miktardaki verilere erişebilmek için kıyameti koparmaktadır.
Çeşitli gruplar, sosyal medya etkileşimleri, sağlık kayıtları, telefon
kayıtları, hükümet kayıtları ve insanlar tarafından bırakılan diğer dijital
izlerden potansiyel olarak avantaj sağlanabileceğini savunmaktadır.
Aynı durumu oracle büyük veri için
hazırlamış olduğu programı tanıtırken 3 ana başlık altında toplamaktadır.
Bunlardan birincisi; “Geleneksel Kurumsal Veri” olup CRM sistemlerindeki
müşteri verileri, ERP sistemlerindeki işlemsel veriler, internet sayfaları
verileri, muhasebe verilerini kapsamaktadır.
İkincisi; “Makine üretimi/algılayıcı verileri” olarak adlandırılmıştır
ve arama detay verileri (CDR), internet sayfası logları, akıllı ölçümleyici
cihaz verileri, üretim algılayıcıları, finans sistemi verilerini içine
almaktadır. Üçüncüsü ise, “Sosyal Medya verileri” olup, forumlara yapılan
yorumlar, twitter mesajları, facebook ve twitter paylaşımları gibi verilerdir (Dijcks, 2011).
boyd ve Crawford (2012), büyük veriyi
kültürel, teknolojik ve bilimsel bir olgu olarak tanımlamaktadır ve teknoloji,
analiz ve mitolojinin karşılıklı etkileşimi vardır. Buna göre:
Teknoloji; büyük veri setini
toplarken, analiz ederken, bağlarken ve karşılaştırma yaparken hatasız bir
şekilde hesaplamaları yapar ve algoritma gücünü maksimize eder.
Analiz;
büyük veri setindeki ekonomik, sosyal, teknik ve hukuki istemlerin
kalıplarını belirler.
Mitoloji; büyük veri setindeki
yaygın inançları, doğruluk ve nesnelliğin doğası ile zekâ ve bilginin yüksek
bir formuna sokar.
Lessing
(1999), sosyal düzenin dört güç tarafından düzenlendiğini iddia etmektedir.
Bunlar; market, hukuk, sosyal normlar ve mimaridir. Teknoloji durumunda ise söz
konusu düzen kodlar tarafından sağlanmaktadır. Büyük verinin gündeme gelmesiyle
bu düzenler daha da güçlenmiştir. Marketler büyük veriyi saf fırsat olarak
görmektedir; pazarlamacılar büyük veriyi reklamcılıkta hedefe ulaşmada, sigorta
sağlayıcılar tekliklerini optimize etmede kullanmaktadır. Yasalara
bakıldığında, veriyi toplama ve saklama konusunda özellikle güvenlik ile ilgili
önlemler önerilmiş durumdadır. Kişiselleştirme gibi özellikler ise, daha fazla
ilgili bilgilere erişmeye izin vermektedir fakat etikle ilgili soruları gündeme
getirmektedir (Pariser 2011). Diğer taraftan büyük veri, kanser araştırmaları,
terörizm, iklim değişimi gibi alanlardaki çeşitli toplumsal sorunlara yeni
anlayış potansiyeli sunan güçlü bir araç olarak görülmektedir (boyd ve
Crawford, 2012).
Büyük
veri ile ilgili çalışmalar giderek yaygınlaştıkça, büyük verinin ne anlama
geldiği konusu giderek karmaşık bir hale gelebilmektedir. Bu noktadan
hareketle, boyd ve Crawford (2012), birtakım sorular ortaya atarak büyük veriyi
sorgulamaya çalışmıştır. Buna göre; büyük veri, sadece geniş bir veri setini
düzenlemek ve analiz etmek için kullanılan araçlar ve prosedürleri kapsayan bir
terim değildir, aynı zamanda düşünme ve araştırmada hesaba dayalı dönüşümü
ifade etmektedir.
Büyük
veri, araştırmalarda da radikal kaymalar yaratmıştır. Hesaba dayalı sosyal
bilimler araştırmalarında yer alan açıklamalar incelendiğinde, Lazer ve
diğerlerine (2009) göre, büyük veri, veri toplama ve analiz kapasitesinde
benzeri görülmemiş genişlik, derinlik ve ölçülebilirlik yaratmıştır. Buna göre,
bilgiye ulaşmada diğer bir ifade ile gerçek bilgiyi elde etmede bakış açısının
dönüşüm gösterdiği görülmektedir. Buna örnek olarak, sosyal medya üzerinden
gerçek zamanlı edinilen verilerin anlamlandırılmasıyla kişilerin
davranışlarının, kişisel özelliklerinin ve hatta duygu durumlarının elde
edilmesi verilebilir.
Manovich
(2011), büyük veri âleminde 3 sınıf insandan söz eder: “veriyi yaratanlar” (her
iki bilinçli olanlar ve dijital iz bırakanlar), “veriyi toplayanlar” ve “veriyi
analiz etmede uzmanlaşanlar”. Son grubun çok az sayıda olduğu düşünüldüğünde
ayrıcalıklı grup olduğu söylenebilir. Çünkü bu kişiler büyük verinin nasıl
kullanılacağının ve kimlerin katılacağının kurallarını belirlemektedir.
Diğer
taraftan, Russom (2011) büyük verinin 2 teknik öğenin bir araya gelmesinden
oluştuğunu belirtmektedir. Birincisi, büyük miktardaki detaylandırılmış veri
yığınıdır. İkincisi ise, tahmin analitikleri, veri madenciliği, istatistik,
yapay zekâ, doğal dil işleme gibi teknikler üzerine kurulmuş farklı araç
çeşitlerinin bir koleksiyonundan oluşmuş ileri düzeydeki analitiklerdir. Tüm
bunların bir araya gelmesinden büyük veri analitikleri oluşur ve günümüzdeki
yeni uygulaması BI (Business Intelligence) ile görülmektedir. Böylece
işadamları, BI ile işleri ve müşterileri hakkında pek çok şey öğrenebilmektedir.
Büyük
verinin geleneksel veriden en önemli farkı normal yollarla işlenememesidir.
Ancak, bu veri tipinin işlenebilmesi ve doğru analiz metotları ile yorumlanması
bu bilgiye ihtiyaç duyan gruplar için kritik sonuçlar çıkarabilmektedir ve özellikle
şirketlerin stratejik kararlarını doğru bir biçimde almalarına, risklerini daha
iyi yönetmelerine ve innovasyon yapmalarına imkân sağlayabilmektedir. Çünkü günümüz dünyasında yapılan analizler
kısıtlı bilgiler üzerinden yapılmaktadır. Bu kısıtlı bilgilere eklenecek olan
analiz edilmiş incelenebilir büyük veri raporları ile beraber kurumsal
şirketler, işlerine daha iyi odaklanarak verimliliklerini arttırabilirler ve bu
sayede de yarış halinde oldukları rakiplerine karşı yenilikçi çözümler üreterek
üst seviyelere çıkabilirler (Dijcks, 2011).
Hatta büyük veri ile gelişmekte olan ülkelerin daha iyi bir noktaya gelmesi
sağlanabilir (Letouzé, Tatevossian ve
Kirkpatrick, 2012).
Büyük
verinin özelliklerine gelince; hız, hacim, çeşitlilik olarak ilk kez 2001 yılında
Doug Laney ifade etmiştir. Pek çok araştırmada 3V (Volume, Velocity, Variety)
olarak ön plana çıkan özellikler, yine hacim, hız, çeşitlilik anlamlarına
gelmektedir.
Russom
(2011)’e göre, bahsi geçen 3V ile büyük verinin sadece verilerin fazlalığından,
diğer bir ifade ile veri hacminden oluşmadığı gözler önüne serilmektedir.
Aksine, Şekil 1’de görüldüğü gibi bir araya geldiklerinde kapsamlı bir tanımı
ve analitiklerin ayrı bir bölümünü oluştururlar.
Volume (hacim)
· Terabyte’lar
· Kayıtlar
· Hareketler
· Tablolar,
dosyalar
|
Velocity
(hız)
|
· Şarj
· Yakın
zaman
· Gerçek
zaman
· Akımlar
|
Variety
(çeşitlilik)
|
· Yapılandırılmış
· Yapılandırılmamış
· Yarı
yapılandırılmış
· Hepsi
|
Şekil 1.
Büyük Verinin 3 V’si
Hacim; kapsamı
oldukça geniş olup, terabyte’ları, tüm kayıtları, tabloları, dosyaları vs.
içine alır. Büyük verinin faaliyet gösterdiği alana göre değişen miktarla
ilgili nitelikleri ifade eder. Verinin büyüklüğü sadece terabyte’lar ile
sınırlı olmayıp tüm kayıtlar verinin hacmini etkiler.
Çeşitlilik; geleneksel veri yapılarının
aksine, büyük veri ciddi bir kaynak çeşitliliği göstermektedir. Örnek olarak,
kayıtları, tuş akışlarını ve sosyal medyayı içeren web kaynakları verilebilir.
Daha önceleri yapılandırılmış veriden söz edilirken şimdilerde
yapılandırılmamış ve yarı yapılandırılmış veri setleri işe dâhil olarak bu
çeşitliliği arttırmıştır.
Hız; büyük verinin veri üretme veya
veri dağıtım sıklığı olarak düşünülebilmektedir. Herhangi bir aygıt veya
sensörden gelen veri akışı, robotik işleyen makineler, ısıyı algılayan
termometreler, video kameraların anlık veri yakalama özellikleri ile sağlanan
büyük miktardaki veri akımlarıdır. McAfee ve Brynjolfsson (2012)’a göre hız
veri hacminden daha önemli bir kavramdır.
Daha
sonraları farklı V’lerin, diğer bir ifade ile farklı özelliklerin de eklendiği
görülmekte olup bunlardan bir tanesi değer’dir. Değer (value), geleneksel
olmayan bu tarz verilerin pazarlama dünyası için yeni pazarlar bulma yolunda
çok değerli olmasıyla ifade edilebilir. Bir diğeri ise verification
(doğrulama)’dır. Bilgi yoğunluğu içinde verinin akışı sırasında “güvenli”
olmasını ifade eden bu bileşen, akış sırasında verinin doğru katmandan, olması
gerektiği güvenlik seviyesinde izlenmesi, doğru kişiler tarafından görünebilir
veya gizliliğini sağlamaktadır.
2.2. Büyük
Veri Kullanımı ve Kullanılabileceği Alanlar
Büyük
verinin pek çok soruna çözüm bulma, iş yaşamında verimi arttırma, eğitimde
öğrenmeyi anlamlandırma ve motivasyon sağlama gibi önemli işlevlerinin olması
akıllara McAfee ve Brynjolfsson (2012)’ın çalışmasında yer alan “ölçemediğini
yönetemezsin” sloganını getirmektedir. Çünkü büyük verinin çözüm sunabilmesi
için öncelikle büyük verinin anlaşılması ve sonra hangi aşamada kullanılması
gerektiğine karar verilmesi gerekmektedir.
IBM
firmasının “Büyük Veri” kavramını tanıtmak için hazırlamış olduğu kitap
çalışmasında, büyük verinin kullanımına başlanmadan önce büyük veri ile ilgili
bazı noktaların kabullenilmesi gerektiğini vurgulamıştır (Zikopoulos ve diğ., 2012). Bu noktalar şu şekildedir:
- · Büyük veri çözümleri, sadece ham yapısal verileri işlemek için değil, çok çeşitli kaynaklardan gelen kısmi olarak yapısal olan veya hiç yapısal olmayan verileri işlemek için de kullanılmaktadır.
- · Büyük veri çözümleri, sadece özet verinin işlenmesinin yeterli olmayıp tüm verinin işlenmesi gereken yerlerde ya da analiz yapmak için örnekleme çözümünün yeterli olmadığı yerlerde kullanılmaktadır.
- Büyük veri çözümleri, iş birimlerinin önceden belirlenemeyen ve sürekli yineleyen, araştırma gerektiren verilerinin inceleneceği yerlerde kullanılmaktadır.
Bu
kabulleri özümsedikten sonra eldeki verinin işlenmesi için karşılaştırma
yöntemleri kullanılarak hangi işleme yönteminin ideal olduğu belirlenmektedir.
Buradaki en önemli nokta gerçekten büyük veri işleme çözümlerine ihtiyacın olup
olmadığının belirlenmesidir. Mevcut yöntemler ile yapılabilen işlemlerde büyük
veri işleme metotlarının kullanımları verilerin güvenilirliğinin kaybolmasına
sebep olabilir. Bu veri kaybının da ortadan kaldırılması için IBM her iki
yöntem ile veri analizinin kaynaştırılarak yapılmasını tavsiye etmektedir. Yani,
bir çözümün her konuyu tam olarak ele alamadığı ancak ikisinin birden gerçek
bir çözüm olabileceği belirtilmektedir
(Zikopoulos ve diğ., 2012).
Dünya
Ekonomik Forumu’nun bu seneki “Büyük Veri, Büyük Etki: Uluslararası Gelişme
İçin Yeni İmkanlar” brifinginde bir çok alanda ülkelerin büyük veri analizleri
yaparak gelişimlerini arttırabileceği belirtilmiş olup söz konusu alanlar Finansal
Servisler, Eğitim, Sağlık ve Tarım olarak sıralanmıştır (World Economic Forum, 2012). Buna göre, eğitim alanında büyük veri
analizi sayesinde, mobil cihazlarda bulunan servisler aracılığı ile elde edilen
veriler ışığında kamu sektörü toplumsal bilgi eksikliklerini tespit edebilir ve
bu sayede de eğitim ihtiyaçları belirlenebilir (Esgin, 2013).
Diğer taraftan, Twitter, yüzlerce
kişinin bilgisayarını ağzına kadar dolduracak veriyi her gün toplayıp, yayıp,
depolamaktadır. Google, IBM, Oracle gibi büyük teknoloji firmaları ise toplanan
bu ham verileri düzenlemek, temizlemek ve hepsinden önemlisi işlemenin
peşindedir. Farklı sektörler bu hızlı değişime ayak uydurmaya çalışmaktadır.
Örneğin, finans uzmanları hangi yatırım araçlarına ilgi olacağını anlamak için
eskiden olduğu gibi sadece piyasaları, haberleri ve geçmiş verileri takip
etmemektedir. Bunların yanı sıra sosyal ağlarda nelerin sıkça konuşulduğunu
bilmek ve insanların nabzını tutabilmenin peşindedirler. Piyasa sinyallerini
barındıran büyük veriden faydalanmak isteyenler, sadece ürünlerini satmak
isteyen şirketler değildir. Devletler, sosyal ağları tarayıp, suç örgütlerini
bulmak isterken, ilaç firmaları insanların Facebook durumlarını takip edip,
hastalıkların dünyada nasıl yayıldığını anlamaya çalışmaktadır (Birbil, 2012).
Büyük veri kullanımı sadece özel
sektörle sınırlı olmamalıdır. Büyük veri analizi, hükümetlere kamu güvenliği,
kamu sağlığı, kamu hizmetleri ve toplu taşıma gibi alanlardaki gelişimlere
fırsat tanımaktadır. Bu fırsatlardan bazıları şu şekildedir (Atkinson, 2011):
·
Elektrik
şirketleri, kaynakları daha iyi yönetmek ve kesintileri önlemek için akıllı
metre ve veri analizlerini kullanabilir.
·
Gıda
denetçileri tarladan sofraya gelen ürünlerin güvenliğini ve takibini veri
kullanarak sağlayabilir.
·
Kamu
sağlığı yetkilileri, bulaşıcı hastalık salgınları tespit etmek için sağlık
verileri kullanabilir.
·
Regülatörler, iyi veri analitiği ile ilaç ve tıbbi cihaz
güvenliğini ve etkinliğini izleyebilir.
·
Polis
departmanları, suç noktaları belirlemek ve suç dalgaları engellemek için veri
analitiği kullanabilir.
·
Kamu
hizmetleri, sızıntıları ve su tüketimini azaltmak için su ve kanalizasyon
kullanımına ait verileri toplamak için sensörler kullanabilir.
·
Acil
durumlarda vatandaşları korumak için polis ve itfaiye, sensör, kamera, GPS ve
iyi iletişim sistemleri kullanabilir.
·
Ulaşımdan
sorumlu devlet daireleri, trafiği azaltmak, kaynakları daha verimli dağıtmak ve
ücretlendirme sistemleri uygulamak için verileri kullanabilir.
Verilerin daha
iyi kullanımı devlet kurumlarına; daha verimli, daha fazla
şeffaf olma ve daha bilinçli kararlar alma yönünde
yardımcı olabilir. Hükümetler; her zaman her yerde bilgiye ulaşılabilir online
sistemler geliştirmek için bulut bilişim kullanabilir. Ancak, hükümet yetkilileri, veri kullanımları teşvik
için daha fazla çaba göstermeleri gerekmektedir.
Büyük verinin avantajlarından yararlanabilmek için Ticaret Bakanlıkları
örneğin bir veri politika ofisi oluşturarak bu işin liderliğini yapabilir. Devlet
kurumları giderek bu verilerin güvenlik
ve kimlik yönetimi gibi sorunları
ile uğraşmak zorunda kalacak, veri analizinin başarılı
kullanılması bu sorunların engel teşkil etmesini önleyebilir. Yerel yönetimler
de öncü verilerin
kullanımına yardımcı olabilir. Örneğin Boston yönetimi,
şehirdeki çukurların nerede olduğunu, vatandaşların GPS ve ivmeölçer ile
donatılmış akıllı telefonlarından gelen verilere göre otomatik belirleyen “Street Bump” mobil uygulamasına destek
sağlamaktadır. Bu gibi araçlar akıllı şehirler
oluşturmaya yardımcı olabilir (Atkinson, 2011)
Birçok vatandaş veri akışını
izlenmesinin, kişisel gizliliğe bir saldırı olarak görmektedir. Ancak büyük
verinin ekonomiye önemli yararlar sağlayacağından şüphe duyulmamaktadır. Yapılan araştırmalar, ABD
sağlık sektörü, potansiyel değeri 300 milyar dolar olarak tahmin edilen büyük
veriyi verimli ve kaliteli bir şekilde kullanabilirse, ulusal sağlık
harcamalarını yüzde sekiz oranında azaltabileceğini göstermektedir. Hatta
gelişmiş Avrupa ülkelerinde, devlet idareleri, büyük veri kullanarak yaklaşık
149 milyar dolar tasarruf sağlanabileceği savunulmaktadır (Manyika ve
diğerleri, 2011).
Ayrıca, büyük veri araştırma ve geliştirme girişimi ile
ABD’nin bazı devlet kurumlarına daha iyi büyük veri analizi ve organizasyonu
sağlamak için 200 milyon dolar’dan fazla harcama yapılacağı bildirilmiş olup,
2020 yılına kadar, profesyonel analistler büyük veriyi kullanarak kişilerin
politika tercihlerini anlayabileceğini savunmaktadır (Anderson, 2012).
Büyük veri pek çok alana katkı
sağladığı gibi eğitim alanında da dikkat çeken konulardan biri olmaya
başlamıştır. Gerek kamu gerekse özel sektör de olsun eğitim kurumlarında ele
alındığı takdirde önemli avantajlar sağlayacağı ve eğitimde verimliliğin
artabileceği söylenebilir. Bu noktadan hareketle, büyük verinin eğitim alanına
yapabileceği katkılar ilgili başlık altında ele alınmıştır.
2.3.
Büyük Veri’nin Büyük Sorunları
Büyük
verinin sunduğu imkânlardan faydalanmak her ne kadar kulağa hoş gelse de
birtakım zorluklar gündeme gelmektedir. Alanyazın incelendiğinde, büyük veri ve
eğitimsel veri madenciliğiyle ilgili zorlukları ele alan pek çok çalışmaya
rastlanmaktadır (Bienkowski, Feng ve Means, 2012; Brown, Chui ve Manyika,
2011; Marx, 2013; McAfee ve Brynjolfsson, 2012; Zikopoulos ve diğ., 2012).
McAfee
ve Brynjolfsson (2012), büyük veriye yönelik söz konusu zorlukları 5 kategoride
ele almıştır: Liderlik, yetenek yönetimi, teknoloji, karar alma, şirket
kültürü. Buna göre, şirketler kendilerine ne düşünüyoruz? sorusundan önce ne
biliyoruz? sorusunu yönelterek işe başlamaları gerekmektedir. Büyük veriye
geçiş yapabilmek için öncelikle eski yönetim alışkanlıklarının bırakılması
gerektiğinden, bu anlayışın kazanılması oldukça zaman alacaktır ve tüm iş yapış
şekillerimizde olsun düşünce tarzımızda olsun dönüşüm yaratacağına hazır olmak
gerekir.
Diğer taraftan, büyük verinin
işlenmesi ve uygun analitiklerin kullanılabilmesi için gereken uzman kişilerin
sayısı oldukça azdır. Amerika’da
“McKinsey Global Institute” isimli bir danışmanlık firmasının araştırma birimi
tarafından 2011 yılında yapılan açıklamaya göre, 2018 yılına
kadar Amerika’nın 140.000’den 190.000’e ve daha fazla sayıda veri
analizi uzmanına 1,5 milyondan fazla veri okuryazarı olan yöneticilere ihtiyacı
vardır (Brown, Chui ve Manyika, 2011).
Ülkemiz açısından bakıldığında, bir
şirket büyük veriyi kullanmaya karar verdiğinde çalıştırmak için veri analitiği
uzmanı arayacaktır ki; yetişmiş işgücü miktarı oldukça azdır. Bununla birlikte
bir sorun da, büyük veriyi anlamaya ve uygulamaya çalışmanın yanı sıra, bu
uzmanları yetiştirecek eğitim-öğretim kurumlarına ihtiyaç vardır.
boyd ve Crawford (2011) ise, büyük
veri kullanımındaki zorlukları şu başlıklar altında açıklamıştır: Gizlilik,
veriye erişim ve paylaşımı, eşdeğer veri kullanımı, büyük ölçekli verilerdeki
hatalar, sosyolojik hataların azalması ve dijital bölünme.
Burada yer alan en önemli
sorunlardan birisi gizliliktir. Verinin dünya genelinde transparanlaşması özel
yaşam ve etikle ilgili sorunları da gündeme getirmektedir. Eğitim alanında
uygulandığında, öğrenci ve öğretmen mahremiyetinin sağlanması ve öğrenci
verilerinin bilinmesi ve işlenmesiyle bağlantılı etik sorumluluklar büyük
dikkat gerektirmektedir. Diğeri ise dijital bölünme olup, verileri işleyebilen
gruplar diğer gruplar üstünde bir hegamonya kurmaya çalışabilirler veya bu
bilgileri onlara karşı kullanabilirler. Bu da toplumsal düzen için de tehlike
yaratabilir.
3. BÜYÜK VERİNİN EĞİTİM ALANINA KATKILARI
Büyük
verinin sunacağı olanaklardan tam olarak yararlanabilmek için yetişmiş insan
gücüne ihtiyaç olduğu kesindir. Bu konuda uzman yetiştirmek için eğitim
kurumlarına da iş düşmektedir. Bu durumu ciddiye alan bir yükseköğretim kurumu
dışında uzman yetiştirme konusunda ülkemizde henüz bir girişim bulunmamaktadır.
Bahçeşehir Üniversitesi “Büyük Veri Analitiği ve Yönetimi” isimli tezsiz yüksek
lisans programı açarak, iş dünyasında "Büyük Veri", "İs
Analitiği" isimleriyle de anılan, "Veri Analitiği" dalının son
yıllarda tüm dünyada, özellikle Amerika'da çok önem kazanan bir bilim dalı
olduğunu vurgulamıştır. Amerika’da ise, 2009 yılı öncesi bu konuda hiç yüksek
lisans programı yokken, 2014 yılı itibari ile otuzu aşkın program bulunmaktadır
(BAU, 2014).
Üniversitelerde
büyük veriye yönelik dersler ve programlar açıldığı taktirde, iş yapış
şeklimizde ve düşünce şeklimizde dönüşümlerin gerçekleşeceği açıktır. Bu
dönüşümlerin açılan bir yüksek lisans programı ile şuan başlangıç aşamasında
olduğu görülmektedir. Bu aşamada, yetiştirilecek veri analitiği uzmanları ile
ileride işgücünün artacağı düşünülebilir.
Diğer
taraftan, eğitimde büyük veri kullanımına yönelik başka bir ilgi alanı
ise, sosyal medya kullanıcısı öğrenciler
hakkında kayıt toplayarak öğrenciler hakkında bilgi sahibi olmaktır. 2006
yılında, Harvard’daki bir araştırma grubu tarafından 1700 kolej öğrencisinin
facebook profilleri toplanmış, ilgi alanları ve arkadaşlık bilgilerinin zaman
içinde nasıl değiştiğini incelemişlerdir (Lewis ve diğ., 2008).
Büyük
verinin üniversitelere güç kazandırarak zenginlik sağlayacağını fark eden üst
sınıf, iyi-kaynağa sahip üniversiteler, verilere erişebilecek ve üst sınıf
üniversitelerdeki öğrenciler büyük olasılıkla büyük sosyal medya şirketleri içinde
çalışmaya davet edilecektir. Diğer çevredekiler ise, bu davetiyeleri alma
olasılığı daha az olacağından, becerilerini geliştiremeyeceklerdir. Sonuç
olarak, bilim adamları arasında bölünmeler başlayacaktır (boyd ve Crawford,
2012). Hal böyle olsa da, büyük veriden yararlanan üniversitelerin hem
kendilerine zenginlik kazandırdığı hem de öğrencilerine iyi firmalarda iş
imkânları sağladıkları açıktır.
Büyük veriyi kullanan birtakım büyük
şirketler, üyelerinin ilgi alanlarını tespit ederek sonraki ziyaretlerinde
onlara yönelik öneriler sunmaktadır. Örneğin, Amazon, kişilerin satın alma geçmişlerine ait
bilgiye dayalı olarak yüksek düzeyde kişiselleştirilmiş
öneriler oluşturan bir sisteme sahiptir.
Yiu (2012)’ya göre, devletler de bu tip sistemler kullanarak vatandaşları için
kişileştirilmiş hizmetler sunabilir. Bu sistem eğitim alanına entegre edildiği
taktirde, bir çevrimiçi kurs sistemi ile kişiye özel eğitimin de
gerçekleştirilebilmesi mümkündür. Bu sayede, her bir öğrenciye özelliği
dâhilinde eğitim sunulabilir, öğrencilere ait kayıtlar tutularak sonraki
öğrenmeleri tahmin edilebilir. Diğer bir açıdan bakıldığında, öğretmenler veya
kurum yöneticileri de öğrenciler hakkında veya yöneticiler öğretmenler hakkında
kişisel olsun duygu durumsal olsun her türlü bilgiye erişebilecektir.
4. EĞİTİMSEL VERİ MADENCİLİĞİ VE
EĞİTİM ALANINA KATKILARI
Veri madenciliği ve veri
analitikleri, araç ve teknikleri daha önceleri araştırma laboratuarları ile
sınırlı iken, günümüzde ileri görüşlü endüstriler, karar verme mekanizmalarında
ve bu bağlamda, işlerini geliştirmede bu
tekniklerden güç sağlamaktadırlar. Yüksek Eğitim Enstitüleri, sağladıkları
servisleri geliştirmek ve öğrencilerin mezuniyeti ile devamlılığını arttırmak
için bu analitiklerden yararlanmaya başlamıştır. Amerika Eğitim Departmanının
Ulusal Eğitim Teknolojileri Planı, kendine özgü bir modele sahip olup, 21.
Yüzyılın teknolojiyle güçlendirilmiş öğreniminde, çevrimiçi öğrenim
sistemlerinden öğretimi güçlendirecek verileri kullanmanın yollarını göz önünde
bulundurmaktadır (Bienkowski, Feng ve Means, 2012).
Eğitimsel veri madenciliği, hesaba
dayalı ve psikolojik metotlar ile öğrencinin nasıl öğrendiğini anlamak için
kullanılan araştırma yaklaşımlarını içeren, yeni bir araştırma alanı olarak
görülmektedir. Bu alan, çevrimiçi öğrenim sistemlerini de etkileyen birçok
alanda araştırılmakta ve modeller geliştirilmektedir. Kullanıcı modelleme, bu
alanlardan bir tanesi olup, öğrencinin ne bildiğini, davranış ve motivasyonunu,
deneyimlerini ve çevrimiçi öğrenmede nasıl memnun olduğunu kapsamaktadır. Bu
bağlamda, basit seviyedeki analitikler, öğrenci çevrimiçi kurstayken, hata
yaptığında ya da ilgisi dağıldığında onu tespit ederek derse
döndürebilmektedir. Daha karmaşığı, öğrencinin tuş tıklamalarından model
oluşturarak sıkıldığını tespit ederek, öğrencinin dikkatini tekrar derse
döndürmektir. Tüm bunlar, verilerin gerçek zamanlı olarak toplanıp,
işlenebilmesinden dolayı mümkün olabilmekte, farklı zaman ölçeklerinde
çalıştırılan çoklu geribildirim döngüleri ile devamlılığı sağlanmaktadır
(Bienkowski, Feng ve Means, 2012).
Diğer taraftan, kullanıcı ya da
öğrenci modellerine bildirilen benzer türdeki veriler kullanıcı profilleri
oluşturmada kullanılabilmektedir. Buradaki profil oluşturma, genel olarak
benzer özellikteki kullanıcıları belirgin özellikler kullanılarak kategorilere
ayırma anlamındadır. Daha sonra bu kategoriler, gruptaki kullanıcılara
alıştırma sunarken, tavsiyelerde bulunurken ve sistemdeki performansının nasıl
olduğu ile ilgili bilgi verirken kullanılabilmektedir.
Kullanıcı modelleme ve profilleme,
gerçek zamanlı adaptasyonlarda/sistemlerde anlamlı görülmektedir. Aksine, bazı
veri madenciliği ve analitiği uygulamaları daha deneysel amaçlıdır. Örneğin, etki
alanı (domain) modelleme, bir konunun nasıl sunulacağını ve detayların
seviyesini anlama amaçlı kullanılmakta olup, büyük ölçüde deneyseldir. Öğrenme
bileşenleri ve öğretimsel prensiplere yönelik çalışmalar da, öğrenimi
geliştirmede neyin etkili olduğunu anlamak için deneyleri kullanmaktadır. Bu
noktadan hareketle, veri madenciliğinde kullanılan teknik ve metotların, genel
öğrenme prensipleri ve yaklaşımlarını desteklediğini söyleyebiliriz.
İlk ve orta dereceli okullar ve okul
bölgeleri, öğretimsel gelişim, güvenlik ve ölçme sonuçlarından yola çıkarak
alanları belirleyebilmek için birtakım enstitü seviyesinde analizleri
kullanmaya başlamıştır. Öğrencilerin öğrenimini ve değerlendirme aktivitelerini
görünür yapmak, öğrencilerin kendi öğrenmelerini izlemelerini ve doğrudan kendi
çabalarının başarılarını nasıl arttırdığını görebilmelerini mümkün kılarak,
onların seviyelerini geliştirmektedir. Öğretmenler öğrencilerin performansı
hakkında bilgi sahibi olabilmekte ve bu bağlamda, öğretim içeriklerini ve
değerlendirmelerini öğrencilere uygun hale getirebilmektedir.
Eğitimsel verinin bir önemli ve
değerli özelliği hiyerarşik olmasıdır. Veriler, tuş vuruşu seviyesi, cevap
seviyesi, oturum seviyesi, öğrenci seviyesi, sınıf seviyesi, öğretmen seviyesi
ve okul seviyesi şeklinde katmanlardan oluşmakta olup, her biri birbiri içine
geçmektedir (Baker, 2011; Romero ve Ventura, 2010). Diğer önemli özelliği ise,
zaman, dizi ve içeriktir. Zamanlama, öğrenme anında ya da pratik yapma oturumu
süresince veriyi yakalamak için önemlidir. Dizi, birbirini izleyen içeriklerin
nasıl oluşturulacağını ve öğretim ve alıştırmaların nasıl sıralanacağını
yansıtmaktadır. İçerik, bir modelin nerede çalıp çalışmadığını bilmek ve
sonuçları açıklamak için önemlidir. Hiyerarşik veri madenciliği için metotlar
ve boylamsal veri modelleme, eğitimsel veri madenciliğinde önemli
geliştiriciler olarak görülmektedir.
Eğitimsel veri madenciliği ile
ilgilenen araştırmacıların (Baker, 2011; Baker ve Yacef, 2009) araştırmalarında
birtakım amaçlar ön planda olup, bu amaçlardan bazıları şu şekildedir:
Öğrencilerin bilgi, motivasyon, üst biliş ve tutumları hakkında detaylı
bilgiler edinmek ve birleştirilmiş öğrenci modelleri oluşturarak, öğrencilerin
sonraki öğrenmelerini tahmin etmek; Öğrenilmiş içeriği ve optimal öğretimsel
sıralamaları betimleyen etki alanı (domain) modelleri keşfetmek veya
geliştirmek; öğrenim yazılımı tarafından sağlanan farklı çeşitteki pedagojik
desteğin etkisini çalışmak; öğrenciyi, etki alanını ve yazılımsal pedagojiyi
birleştiren modeller olarak hesaba dayalı modeller oluşturarak öğrenim ve
öğrenci hakkında bilimsel bilgiyi geliştirmek.
Bahsi geçen amaçlara ulaşmak için
eğitimsel veri madenciliği araştırmacıları 5 kategoriden oluşan teknik
metotları kullanmaktadırlar (Baker, 2011). Bunlar; Tahmin, kümeleme, ilişki
madenciliği, insan yargılarını süzgeçten geçirme, modellerle buluş/keşfetme. Bu
teknikleri kullanan eğitimsel veri madenciliği araştırmacıları, araştırmalarını
yapmak için çeşitli modeller geliştirmektedirler.
Çevrimiçi öğrenim sistemleri, akıllı
öğretim sistemlerini, sanal laboratuarları veya simülasyonları kullanan
etkileşimli öğrenim ortamları olarak ifade edilebilir (Bienkowski, Feng ve
Means, 2012). Çevrimiçi dersler, bir kurs yönetim sistemi (Moodle, Sakai vs.)
veya bir öğrenim platformu ile sunulabilmektedir. Büyük veri ile bahsi geçen
öğrenim yönetim sistemlerindeki öğrencilerden bilgi toplanarak, bir sonraki
ders ya da kurs, onların özelliklerine göre hazırlanabilmektedir. Bienkowski,
Feng ve Means (2012)’ye göre, öğrenci çevrimiçi ortamda öğrenirken,
teknolojinin gücünden yararlanarak bir ön değerlendirme yapmak için birçok
avantaj vardır. Buna göre, bir çevrimiçi sistem, manuel metotlara göre,
öğrencinin nasıl öğrendiğine dair çok daha fazla detaylı bilgiyi
toplayabilmektedir. Öğrenci çalışırken, sistem onların girdilerini
yakalayabilir ve onların problem çözme adımlarından, bilgi ve strateji kullanımlarından
kanıt toplayabilir (U.S. Department of Education, 2010, p.35). Dahası, belirli
bir öğrencinin bir sonraki ders içeriğinde, önemli değerlendirme sınavları da
dâhil olmak üzere, nasıl bir performans göstereceğini tahmin edebilir. Bu
noktadan hareketle, veri-zengini sistemler, öğrencilere, eğitimcilere ve
yöneticilere, bilgilendirici ve işlenebilir geribildirimler sağlayabilmektedir.
Eğitimsel veri madenciliği ve
öğrenme analitik teknikleri maliyet ve birtakım zorluklardan etkilenmektedir.
Algoritma geliştiricileri bu teknikleri gerektiren hesaba dayalı maliyetlerin
farkına varmaya çalışırken, Bilgi Teknolojileri Departmanları, yüklü verileri
toplama ve depolamaya bağlı maliyetleri anlamaya çalışmaktalar. Diğer teknik
zorluk, eğitimsel veri sistemlerin, birlikte çalışabilir olmayışıdır. Bu
bağlamda, yönetilebilir verinin ve sınıf seviyesindeki verinin bir araya
getirilmesi zorluğu artmaktadır. Diğer taraftan, öğrenci ve öğretmen
mahremiyetinin sağlanması ve öğrenci verilerinin bilinmesi ile işlenmesiyle
bağlantılı etik sorumluluklar büyük dikkat gerektirmektedir.
5.
SONUÇ
Bu çalışmada, büyük veri ve
eğitimsel veri madenciliği çalışmaları ile eğitim alanına katkıları
incelenmiştir. Günümüz teknolojisinin getirilerinden olan büyük veri ve
eğitimsel veri madenciliği çalışmalarının pek çok alana önemli katkılar
sağlayacağı açıkça görülmektedir. Şuan büyük veri ve özellikle eğitimsel veri
madenciliği alanlarının oldukça yeni olması, öncelikle bu alanların
tanımlanması ve kavranması ile ilgili çalışmaları gerekli kılmaktadır ki;
yeterli anlayış kazanıldığında yapılacakların önüne geçilmesi imkânsız
olacaktır.
Büyük veri, özel sektör, kamu ve
birey bazında düşünüldüğünde herkesin avantajlarından yararlanabileceği bir
alandır.
KAYNAKÇA
Anderson,J, Q. (2012). Big Data:
Experts say new forms of information
analysis will help people be more nimble and adaptive, but worry over
humans’ capacity to understand and use these new tools.
http://pewinternet.org/~/media/Files/Reports/2012/PIP_Future_of_Internet_2012_Big_Data.pdf,
Erişim: 18 Aralık 2012.
Atkinson, R.(2011). Government
Opportunities to Harness “Big Data”. Information Technology and Innovation Foundation (ITIF),
http://www.innovationfiles.org/government-opportunities-to-harness-%E2%80%9Cbig-data%E2%80%9D/
web adresinden 26 Aralık 2012 tarihinde edinilmiştir.
Baker, R.S. J. d. (2011). Data Mining
for Education, International Encyclopedia
of Education, 3rd ed., edited by B. McGaw, p. Peterson and E. Baker,
Oxford, UK: Elsevier.
Baker, R.S. J. d. & Yacef, K.
(2009). The State of Educational Data Mining in 2009: A Review
and Future Visions, Journal of
Educational Data Mining,
1(1): 3-17.
BAU (2014). Bahçeşehir
Üniversitesi Yüksek Lisans & Doktora. Büyük Veri Analitiği ve Yönetimi (Big
Data). http://www.bahcesehir.edu.tr/icerik/7502-veri-analitigi-ve-yonetimi# web
adresinden 2 Eylül 2014 tarihinde edinilmiştir.
Bienkowski, M., Feng, M. &
Means, B. (2012). Enhancing Teaching and Learning Through Educational
Data Mining and Learning Analytics-An Issue Brief, http://tech.ed.gov/learning-analytics/ web
adresinden 10 Aralık 2013 tarihinde edinilmiştir.
Birbil, İ. (2012).Tam Gaz Büyüyen
Dev: Big Data. Radikal Gazetesi,
20.10.2012.
boyd, D. & Crawford, K.
(2012). Critical Questions For Big Data, Information,
Communication & Society, 15:5, 662-679.
Brown, B., Chui, M. & Manyika, J.
(2011). Are You Ready for the Era of ‘Big Data’? McKinsey Global Institute, http://www.t-systems.com/solutions/download-mckinsey-quarterly-/1148544_1/blobBinary/Study-McKinsey-Big-data.pdf
web adresinden 20 Aralık 2013 tarihinde edinilmiştir.
Dijcks, J.-P. (2011). Oracle: Big
Data for the Enterprise. California: Oracle.
Erkan, S. (2012). Büyük Veri -
Big Data Nedir? Uygulamalar ve Fırsatlar [Yönetici Özeti],
http://www.karel.com.tr/blog/buyuk-veri-big-data-nedir-uygulamalar-ve-firsatlar-yonetici-ozeti
web adresinden 2 Eylül 2014 tarihinde edinilmiştir.
Esgin, M. S. (2013). Fırsatlar ve
Tehditler Boyutlarıyla Veri Yönetimi Alanının Yeni Oyuncusu Olarak Büyük Veri. Yazılım Akademisi 2013, http://www.yazilimakademisi.org/
web adresinden 12 Eylül 2014 tarihinde edinilmiştir.
Lazer, D., Pentland, A., Adamic,
L., Aral, S., Baraba´si, A., Brewer, D., Christakis, N., Contractor, N., Fowler, J., Gutmann, M., Jebara, T., King, G., Macy, M.,Roy,
D. & Van Alstyne, M. (2009). Computational social science, Science, vol.323, no. 5915, pp. 721–723.
Lessig, L. (1999). Code: and Other Laws of Cyberspace, Basic
Books, New York, NY.
Letouzé, E., Tatevossian, A. &
Kirkpatrick, R. (2012). Big Data for Development: Challenges &
Opportunities. New York: UN Global Pulse.
Lewis, K., Kaufman, J., Gonzalez, M., Wimmer, A. &
Christakis, N. (2008).‘Tastes, ties, and time: a new social network dataset
using Facebook.com’, Social Networks,
vol. 30, no. 4, pp. 330–342.
Manovich, L. (2011). Trending: the promises and the
challenges of big social data, in Debates in the Digital Humanities, ed. M. K.
Gold, The University of Minnesota Press, Minneapolis, MN,
http://www.manovich.net/DOCS/Manovich_trending_paper.pdf web adresinden 15 Temmuz 2013 tarihinde
edinilmiştir.
Manyika,J., Chui, M.,Brown,B.,
Bughin,J., Dobbs,R., Roxburgh,C. & Byers,A.H.(2011).Big Data:The Next
Frontier for Innovation, Competition, and Productivity. McKinsey Global Institute, http://www.mckinsey.com/Insights/MGI/Research/Technology_and_Innovation/Big_data_The_next_frontier_for_innovation
web adresinden 17 Aralık 2012 tarihinde edinilmiştir.
Marx, V. (2013). The Big Challenges of Big Data. Nature, v.498, 255-60.
McAfee, A. & Brynjolfsson, E.
(2012). Big Data: The Management Revolution. Harvard Business Review, http://hbr.org/2012/10/big-data-the-management-revolution/ar
web adresinden 5 Eylül 2014 tarihinde edinilmiştir.
Pariser, E. (2011). The Filter Bubble: What the Internet is
Hiding from You, Penguin Press, New York.
Romero,
C.R. & Ventura, S. (2010). Educational Data Mining: A Review of the State
of the Art, IEEE Transactions on Systems,
Man and Cybernetics, Part C: Applications and Reviews, 40(6): 601-618.
Russom, P. (2011). Big Data Analytics. TDWI Best Practice
Report, TDWI (The Data Warehousing InstituteTM).
The New Yok Times (2012). The Age of
Bigdata. http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the-world.html?_r=0
web adresinden 28 Ağustos 2014 tarihinde edinilmiştir.
U.S. Department
of Education (2010). National Education Technology Plan. http://www.ed.gov/technology/netp-2010
Erişim: 5 Aralık 2012.
Yiu, C. (2012). The
Big Data Opportunity Making government faster, smarter and more personal. http://www.policyexchange.org.uk/images/publications/the%20big%20data%20opportunity.pdf
web adresinden 11 Aralık 2012 tarihinde edinilmiştir.
Wikipedia. (2012, December 09). Big
Data. Retrieved from Wikipedia, the free encyclopedia: http://en.wikipedia.org/wiki/Big_data
web adresinden 10 Eylül 2014 tarihinde edinilmiştir.
Wired (2014). How a Math Genius
Hacked OkCupid to Find True Love, Wired
Magazine, http://www.wired.com/2014/01/how-to-hack-okcupid/
web adresinden 1 Eylül 2014 tarihinde edinilmiştir.
World Economic Forum. (2012). Big
Data, Big Impact: New Possibilities for International Development. Geneva:
World Economic Forum.
Zikopoulos, P., Eaton, C., Redoos,
D., Deutsch, T., & Lapis, G. (2012). Understanding Big Data.
Newyork: Mc Grawhill.
Cite:
Hiç yorum yok:
Yorum Gönder