Logo tr.artbmxmagazine.com

Veri madenciliği. paha biçilmez varlık olarak bilgi

İçindekiler:

Anonim

Paha biçilmez bir varlık olarak bilgi

Neoklasik ekonomik modellerde, piyasadaki ajanların davranışını açıklamak için koşulların oluşturulmasına izin veren bir varsayım bol miktarda bulunur. Ancak bu varsayım gerçek durumlarda nadiren bulunur: Bu varsayım mükemmel bilgidir.

İdeal bir dünyada, pazarda rekabet eden tüm acenteler, tüketicilerinin tercihleri ​​ve rakiplerinin kararları hakkında mükemmel bilgiye sahiptir. Dahası, tüketiciler pazarda meydana gelen tüm olayların mükemmel bir şekilde farkındadır ve bu mükemmel bilgiye dayanarak kararlar verir.

Kusursuz bilgi, tüm temsilcilerin piyasada meydana gelen tüm olaylardan tam olarak haberdar olduğu bir durumu ifade eder. Bununla birlikte, mükemmel bilgi elde edilmesi imkansız bir durumdur çünkü piyasalar sürekli ve durdurulamaz bir dönüşüm içindedir.

Şirketler, potansiyel tüketicilerindeki eğilimleri ve tercihleri ​​tanımlamalarına ve rakiplerinin potansiyel hareketlerini analiz etmelerine olanak tanıyan metodolojiler üretme ihtiyacına sahiptir. Tüm bu değişkenleri bilmek söz konusu şirket için paha biçilmezdir çünkü şirketin hayatta kalması ve büyümesi, alınan kararlarla bağlantılıdır.

Bununla birlikte, piyasa bilgileri olabildiğince statik olma eğilimindedir. Sosyal eğilimler, siyasi hareketler, dini inançlar ve ideolojik eğilimler nedeniyle tüketiciler, fikirlerini ve tercihlerini sürekli olarak uyarlar. Dolayısıyla belirli bir zamanda piyasa tercihlerinin bilinmesi, bu bilgilerin uzun vadede güncel kalacağının garantisi değildir.

Şirketlerin, mümkün olan en iyi seçimi yapmalarına olanak tanıyan eğilimleri belirlemek için büyük miktarda bilgiyi elde etmelerine ve analiz etmelerine olanak tanıyan araçlar tasarlamaları gerekir. Milyonlarca farklı tercihin olduğu bir dünyada, şirketler mümkün olduğunca çok müşteriyi memnun etmelerine olanak tanıyan seçeneği seçmelidir.

Doğru bilgiye sahip olmak, bireylerin her durum için uygun kararlar almasına olanak tanır. Yeterli bilginin bulunmadığı bir senaryoda, eğilimin başarısızlık veya şansa doğru yöneldiği açıktır. Karar vermek için bilgi gerekli olduğundan, değeri hesaplanamaz.

Gerçek dünyada, mükemmel bilgi var olmayan bir unsurdur. Bilginin bir maliyeti vardır ve şirketlerin ilgili bilgileri elde etmek için yaptıkları masrafları maliyetlerine dahil etmeleri gerekir. Bilgiyi verimli bir şekilde elde eden bir organizasyon, sonsuz potansiyele sahip bir organizasyondur.

Şirketler piyasa eğilimleri hakkında nasıl bilgi edinebilir? Teknolojik evrimle birlikte kullanıcılar şirketlere giderek daha yakın hale geliyor. Şirketler, birkaç yıl önce kendi tüketicileri ile yaptıkları anketlerle verilerini elde ettiler. Bununla birlikte, İnternetin bir kitle iletişim aracı olarak tanıtılmasıyla, bireyler tercihlerini tercihlerini belirleme yollarının kullanıldığı sosyal ağlar aracılığıyla gösterebilirler.

Şirketler, metodolojilerine ve seçilen örneklemin boyutuna bağlı olarak farklı bir doğruluk derecesine sahip olan çeşitli yollarla pazar bilgilerini elde edebilirler. Bununla birlikte, bu analizler genellikle çıplak gözle bir eğilimin elde edilemeyeceği büyük bir ham veri tabanı ile sonuçlanacaktır.

Milyonlarca kalitatif ve kantitatif veri içeren bir veri tabanını analiz etmek için, bilginin en önemli kısımlarını, trendleri ve fırsatları tanımlamamıza izin veren metodolojileri kullanmak gerekir. Veritabanı analizi ile madencilik arasında bir analoji vardır. Madencilikte büyük miktarda kaynak kullanılmaktadır, ancak bunların kullanılması için özel planlamalar gerekmektedir.

Bir madencilik şirketi, ilk önce yeraltı içeriğinin belirli bir analizini yapmadan kazı yapmak için milyonlarca dolar harcamaz. Şirket rastgele bir bölgeye girip bir maden açmaz. Aynı şekilde, bir veri analisti fazladan kaynak harcadığı bir analiz yapmaktan kaçınan belirli metodolojilere sahiptir.

Veri madenciliği, psikolojiden istatistik, hesaplama, matematik ve hatta yapay zekada uygulamalı teknolojiyi kullanan birçok bilim ve disiplini içeren bir süreçtir. Veri madenciliği, analistlerin doğru kararlar vermesini sağlayan eğilimleri belirlemeyi amaçlar.

Veri madenciliğinin kullanımı sadece pazar analizine karşılık gelmez, bu araç büyük miktarda bilginin analizini gerektiren herhangi bir araştırmada kullanılabilir. Bununla birlikte, bu kısa makalede, aracın kullanımı piyasalar ve kuruluşlar bağlamında analiz edilecektir.

Veri madenciliği nedir?

Birkaç paragrafa atıfta bulunulan analojiyi dikkate alarak, veri madenciliğinin ne olduğuna dair muğlak bir kavram inşa edilebilir. Fayyad ve diğerlerine (1996) atıfta bulunan Vallejos'a (2006, s. 11) göre, veri madenciliğinin “Önemsiz olmayan bir kimlik geçerliliği süreci, yeni, potansiyel olarak yararlı ve anlaşılabilir modellerin anlaşılabilirliği verilerde gizli. "

Bu teknik tanım, aracın kullanımını anlamak için bazı temel kavramlar sunar. Vallejos (2006) ayrıca Molina ve diğerleri (2001) 'nin kavramı iş açısından açıklamasını aktararak kavramı şu şekilde tanımlamaktadır: "Amacı, bir dizi alanı karar vermeye yönelik önyargı sağlayan veritabanları. "

Veri madenciliğinin amacı, kuruluşların eylemlerinin akışını belirleyen kalıpları bulmaya çalışan mevcut bilgilerin analizidir. Veri madenciliği, veritabanlarından bilgi çıkarma olarak bilinen çok daha büyük bir sürecin bir aşamasıdır.

Veritabanı analizini içeren disiplinler, istatistikleri, yapay zekayı, bilgisayar grafiklerini ve muazzam işlem gücünü içerir. Dakikada milyonlarca sonucu yönetip hesaplayabilen bir hesaplama gücü olmadan yeterli bir veri analizi metodolojisi düşünmek imkansız olurdu.

Bununla birlikte Vallejos'a (2006) göre veri madenciliği fikri modern hesaplamanın doğuşundan doğan bir kavram değildir. Veri madenciliği kavramlarını açıklamak için "veri tabanlarında bilgi keşfi" kavramını anlamak gerekir. Bu kavram, doğru metodolojilere dayalı olarak doğru veri analizi yapabilmek için temel bir unsurdur.

Veritabanlarında bilgi keşfi

20. yüzyılda bilgi işlemin evrimi ile birlikte, bilginin kendisinin işlenme maliyetlerini azaltmanın yanı sıra bilgi saklama maliyeti de önemli ölçüde azalmıştır. Maliyetlerin düşürülmesi ile, bilginin analizinin kendisi, daha düşük bir maliyetle son derece ayrıntılı çalışmalar yapmak mümkün olana kadar dönüştürülmüştür.

Bununla birlikte, ham bilgiler içinde kalıpların oluşturduğu gizli bilgileri analiz edemiyorsanız, büyük miktarda veriye sahip olmak faydasızdır. Verinin gerçek değeri, ondan çıkarılabilen bilgilerdedir. Başarılı işletmeler, beklenti ve hazırlığa dayalı olarak doğru kalıp araştırması ve karar verme üzerine kurulur.

Vallejos'a (2006) göre, dünyanın bilgisini üretme ve analiz etme kapasitesi o kadar artmıştır ki, her 20 ayda bir ikiye katlanır. Kuruluşlar SQL dizileri gerçekleştirirtemel bilgileri almak için. Ancak, verilerdeki en önemli eğilimleri tanımlayabilmek için daha gelişmiş teknikler gerektirirler.

Vallejos'a (2006) göre CBD, içlerinde yararlı bilgiler bulmak için büyük miktarda veriyi otomatik olarak işlemeyi amaçlamaktadır. Bu şekilde kullanıcı, bilgileri kendi rahatlığı için kullanabilir. Bilgi, genelden özele analiz edilmesi gereken belirli bir hiyerarşiye sahiptir.

Veri madenciliğine dayalı teknikler

Veri madenciliğinin temelleri, uzun bir araştırma sürecinin sonucudur. Tekniklerin gelişimi, bilgilerin bir bilgisayar ekipmanında saklanmasıyla başladı. Veri madenciliği 3 teknolojiye dayanmaktadır:

  • Büyük veri toplama Güçlü mikroişlemcili bilgisayarlar Veri madenciliği algoritmaları

Vallejos (2006), ticari kullanılabilirlik veritabanlarının eşi görülmemiş bir oranda büyüdüğünden bahsetmektedir. Veri madenciliği algoritmaları, klasik istatistiksel yöntemlerin bilinçli olarak üstesinden gelmenin bir yolunu bulur.

Veri madenciliğinin temel özellikleri ve hedefleri şunlardır: (Vallejos, 2006)

  • Veri ambarlarında depolanan veritabanları içindeki verileri derinlemesine keşfedin. Veriler internetten veya intranet kaynaklarından elde edilebilir. Veri madenciliği ortamı, istemci-sunucu mimarisini korur. Araçlar izin verir Kamu kayıtlarına gömülü bilgilerden cevher çıkarmak Madenci, veri tatbikatları ile güçlendirilmiş bir son kullanıcıdır Verileri kazmak beklenmedik sonuçlara olanak tanır Veri madenciliği araçları kolayca birleştirilir ve uygun şekilde analiz edilir Madencilik 5 tür bilgi üretir o İlişkilendirmeler o Sıralar o Sınıflandırmalar o Gruplamalar veya Tahminler

Veri madenciliği, deneyin veri toplamak için tasarlandığı hipotezi formüle ettiği için bilimsel bir yöntemi kurtarır. Bu sistem ile yeni bilgiler edinebilirsiniz. Veri madenciliği, doğrulayıcı bir yaklaşımdan çok keşifsel bir yaklaşım sunar.

Veri madenciliğinin kapsamı

Veri madenciliği teknolojisi son yıllarda çok sayıda ilerleme kaydetmiştir. Mevcut teknoloji ile yeni yetenekler sağlanarak yeni iş fırsatları oluşturulabilir. Ancak, veri madenciliğinin maliyetleri uzmanlaşma derecesinin artmasıyla artma eğilimindedir. Vallejos'a (2006) göre kapsamlar aşağıdaki gibidir:

  • Otomatik eğilim ve davranış tahmini:

Veri madenciliği, büyük veritabanlarında öngörülebilir bilgileri bulma sürecini otomatikleştirmenizi sağlar. Sorular normalde manuel analiz gerektirir, ancak artık doğrudan cevaplanabilir.

Bu analizin gözlemlendiği bir örnek, hedeflere yönelik sistematik pazarlamanın gerçekleştirildiği zamandır. Veri madenciliği, yeni pazarlama kampanyalarını hedeflemek için sonuç analitiğini kullanır. Bu teknikle, belirli nüfus sektörlerinin davranışlarını belirleyebilir ve davranışlarını tekrarlayabiliriz.

  • Önceden bilinen modellerin otomatik keşfi:

Veri madenciliği araçları, önceden bilinen modelleri tek adımda belirlemenizi sağlar. Bu yöntem aynı zamanda bankacılık sistemlerindeki hileli işlemleri belirleyebilir ve anormallikler bulabilir.

  • Otomatik kütle analizi:

Paralel işleme sistemlerinde otomasyon teknikleri uygulandığında, veritabanlarını dakikalar içinde analiz etmek mümkündür. Kullanıcılar, giderek karmaşıklaşan dakikalarda otomatik analiz gerçekleştirme olanağına sahiptir. Bu yüksek hız, daha iyi tahminlere izin verir.

Veri madenciliği ile ilgili bir problem nasıl çözülür?

Veri madenciliğinin, büyük veri kümelerindeki bilgileri tespit etmenin mümkün olduğu bir süreç olduğunu tanımladıktan sonra, aracın kullandığı metodolojiye yaklaşabiliriz. Madenciliğin temel ilerlemesinin, geleneksel tekniklerle görünmeyen karmaşık ilişkileri analiz etmek olduğunun farkında olmalıyız.

Microsoft'un SQL sunucusu (Microsoft, 2014) bize veri analizi alanında yeni başlayanlar için anlaşılması kolay bir metodoloji sunuyor. Daha önce de bahsettiğimiz gibi, SQL dizilerinin basit analizler yapma konusunda derin bir faydası vardır, ancak tüm bilgileri elde etmek için daha gelişmiş teknikler gereklidir. Bu durumda SQL metodolojisini giriş niteliğinde analiz edeceğiz.

Bir veri madenciliği modeli gerçekleştirmek için aşağıdaki anları tanımlamak gerekir (Microsoft, 2014):

  1. Sorunu tanımlayın Verileri hazırlayın Verileri keşfedin Modeller oluşturun Modelleri keşfedin ve doğrulayın Modelleri dağıtın ve güncelleyin

Ancak bu süreç tek yönlü değildir, döngüseldir. Modeli uyguladıktan sonra, yeni modellerin geliştirilmesinin mümkün olduğunu teyit etmek için sürecin tekrar yapılması gerekmektedir. SQL'in gerçekleştirmesine izin verdiği veri madenciliği kendini geliştirme eğilimindedir.

Sorunu tanımlama:

Aşağıdaki şemada vurgulandığı gibi, veri madenciliği sürecindeki ilk adım, sorunu net bir şekilde tanımlamak ve soruna bir yanıt sağlamak için verileri kullanma yollarını düşünmektir. (Microsoft, 2014)

Verilerin hazırlanması:

Veri temizleme, yalnızca geçersiz verilerin kaldırılmasını veya eksik değerlerin enterpolasyonunun yapılmasını değil, aynı zamanda verilerde gizli korelasyonların aranmasını, en doğru olan veri kaynaklarının tanımlanmasını ve analiz için hangi sütunların en uygun olduğunu belirlemeyi içerir. (Microsoft, 2014)

Verileri keşfetmek:

İş problemini anlamak için verileri keşfederek, veri setinin hatalı veri içerip içermediğine karar verebilir ve ardından sorunları düzeltmek için bir strateji icat edebilir veya işinize özgü davranışların daha derin bir tanımını alabilirsiniz. (Microsoft, 2014) Modelin oluşturulması:

Yapıyı ve modeli işlemeden önce, bir madencilik modeli, girdi için kullanılacak sütunları, tahmin ettiği özniteliği ve algoritmaya verileri nasıl işleyeceğini söyleyen parametreleri belirten basit bir kaptır. (Microsoft, 2014)

Modeli suistimal etmek ve doğrulamak:

Eğitim veri kümesi modeli oluşturmak için kullanılır ve test veri kümesi, tahmin sorguları oluşturarak modelin doğruluğunu kontrol etmek için kullanılır. (Microsoft, 2014)

Modeli uygulamak ve güncellemek:

Madencilik modelleri üretim ortamına girdikten sonra, tahmin modellerini kullanmak, istatistiksel sorgular oluşturmak veya raporlar oluşturmak gibi ihtiyaçlarınıza bağlı olarak farklı görevleri gerçekleştirebilirsiniz. (Microsoft, 2014)

Veri analitiğinin geleceği

Sosyal medyanın evrimi ile internete erişim için yeterli satın alma gücüne sahip bireyler, sonsuz ve paha biçilmez bir bilgi kaynağı haline geldi. Şu anda, kullanıcılar kendi zevklerini ve tüketim alışkanlıklarını İnternet üzerinden dış kaynak olarak kullanıyor, bu da veri elde etmeyi kolaylaştırıyor.

Bilgi sistemleri içindeki bu tür bir kontrol ile şirketler, her bireyin tüketim alışkanlıklarını bilme ve kullanıcının kullanıma sunduğu bilgilerde gösterilenlere göre reklam üretme becerisine sahiptir.

Şu anda İnternet reklamcılığı, temel olarak bireylerin tercihlerinin bireysel çalışmasına dayanmaktadır. Veri madenciliğinin geliştirilmesinin sadece eğilimleri değil, aynı zamanda bireysel davranışları da tanımlayan sistemler oluşturmaya izin vermesi esastır.

Tez önerisi:

Konu şu şekildedir: "Veri madenciliği: Bireysel tüketiciye yönelik pazarlama için bir araç kullanın", sosyal ağlar aracılığıyla mevcut olan bilgilerin yönetilmesine izin veren ve onları hedeflenen reklam hedeflerine odaklayan veri madenciliği araçları geliştirmek için.

Tezin amaçları:

  • Veri madenciliğinin geliştirilmesi Pazarlama tekniklerinin geliştirilmesi Veri analizinin teknik uygulaması

kaynakça

Microsoft. (2014). SQL sunucusu 2014. https://msdn.microsoft.com/esmx/library/ms174949(v=sql.120).aspx adresinden alındı

İpuçları ve Püf Noktaları. (2012). SQL'deki temel ifadeler. Https://cwflores.wordpress.com/2008/09/11/sentencias-basicas-en-sql/ adresinden erişildi.

Vallejos, S. (2006). Kuzeydoğu Ulusal Üniversitesi. Veri Madenciliğinden Elde Edilen:

exa.unne.edu.ar/informatica/SO/Mineria_Datos_Vallejos.pdf

SQL deyimleri, çeşitli işlem türlerini belirlemenize olanak tanıyan, veritabanlarına erişmek için bildirim temelli bir dildir. Bu cümleler, bilgiyi elde etmek için cebir ve ilişkisel hesabın kullanılmasına izin verir. Kaynak: (İpuçları ve İpuçları, 2012).

Orijinal dosyayı indirin

Veri madenciliği. paha biçilmez varlık olarak bilgi