Logo tr.artbmxmagazine.com

Veri madenciliği

İçindekiler:

Anonim

Bilginin mevcut olmamasından genellikle daha kötü olan bir şey, çok fazla bilgiye sahip olmak ve bunları nasıl kullanacağını bilmemektir. Son yıllarda, insanlık veri üretme ve toplama konusunda büyük bir yetenek ve kapasite geliştirdi, çünkü verileri düşük bir depolama maliyetiyle işleyebilen makineler var.

Ancak yine de, bu büyük miktardaki verilerin içinde, çok önemli olan ancak klasik bilgi erişim teknikleri kullanılarak erişilemeyen birçok gizli bilgi vardır.

Bu bilginin tüm keşfi, veri madenciliği veya Datamining sayesinde mümkündür; bu makalenin geliştirilmesinde göreceğimiz diğer özelliklerin yanı sıra, verilerdeki kalıpları ve ilişkileri tanımlamaya izin veren yapay zeka kullanımıdır. modeller yaratmak.

Bu makalenin geliştirilmesi sırasında, veri madenciliği konusu, özellikleri, metodolojisi ve temel uygulama alanları nelerdir.

Anahtar Kelimeler:

  • Veri işlemeVeri madenciliğiBilgi analiziVeri işlemeVeri işleme

VERİ MADENCİLİĞİ

Genel konular

Şu anda yaşadığımız çağda, bilgi çağı olarak kabul edildiğimizde, dünyanın dört bir yanındaki olayları hızlı bir şekilde öğrenebildiğimiz için verilerin kafa karıştırıcı ve rengarenk bir duvar oluşturabilmesi ilginçtir..

Karar vermek için kullanılan hammadde her zaman en uygun fiyatlı değildir, bu nedenle dışarı çıkıp aramak gerekir ve basit görünmesine rağmen ekonomik bir fayda elde etmek için verileri seçici olarak çıkarmak gerektiğinden değildir.

Tüm bunlar veri madenciliği olarak bilinir, ancak daha sonra doğru bir şekilde tanımlanacak olsa da, Pamuk Prenses cüceleri değerli taşları bulmak için işe giderse, onları elde etmek için uygun kazma ve kürekleri almak zorunda kalacaklarını söylemek gibidir. Bu durumda doğru bilgiyi almak olacaktır.

Veri madenciliğinin temel amacı, bir veri setinden bilgiyi çıkarmak, onu çalışmak ve daha sonra kullanılmak üzere anlaşılabilir bir yapıya dönüştürebilmek için onu cilalamaktır.

Veri madenciliği kullanan kuruluşlar, yanlış adımlar atmayı bıraktıkları için yatırımlarının geri dönüşünü hızlı bir şekilde görebilirler, bir uygulama, bir süpermarkette tüketim alışkanlıklarının tespit edilmesidir. (Durán Mena, 2014)

Veri madenciliği nedir?

Çeşitli yazarlardan veri madenciliğinin bazı tanımları:

  • Veri madenciliği, verilerde var olan kalıpları ve eğilimleri çıkarmanıza olanak tanıyan matematiksel bir analiz kullandığından, büyük veri kümelerinden ek bilgileri tespit etmenizi sağlayan bir süreçtir. (SQL Server, 2014) Veri madenciliği, amacı büyük veritabanlarından ilgili belirli bilgileri arama programları ve açıklaması olan ve keşfedilebilen diğer göstergeler aracılığıyla çıkarmak, keşfetmek ve depolamak olan işlemdir. bu araçları uygulayarak. (Larrieta & Santillán Gómez, 2007) Veri madenciliği, aynı zamanda «veri veya bilgi keşfi» olarak da bilinir ve verileri farklı bakış açılarından analiz etme ve bunları yararlı bilgiler olarak özetleme sürecidir. (Bilişim Teknolojileri,Veri madenciliği veya veri madenciliği, davranışları açıklamaya izin veren eğilimleri veya kuralları tekrarlayan kalıpları bulmak için otomatik veya yarı otomatik olarak büyük veri tabanlarının araştırılmasına izin veren bir dizi teknik ve teknolojidir. belirli bir bağlamdaki verilerin (Sinnexus, 2007)

Veri madenciliği uygulaması

(SQL Server, 2014) Veri madenciliği modelleri aşağıdaki senaryolarda uygulanabilir:

  • Tahmin: Satışların hesaplanmasına ve yüklerin veya sunucu arıza süresinin tahmin edilmesine olanak tanır Risk ve olasılık: Doğru posta dağıtımı için en iyi müşterileri seçmeye yardımcı olur ve teşhis olasılıklarını veya diğer bazı sonuçları atar Öneriler: Ürünleri belirlemek için kullanılır Birlikte satılabilir ve bazı öneriler üretebilir. Arama dizileri: Müşterilerin bir alışveriş sepetine girdiği ürünleri analiz edin ve böylece olası olayları tahmin edin. Gruplama: Müşterileri veya olayları belirli kümelere ayırın ve böylece yakınlıkları analiz edin veya tahmin edin.

Veri Madenciliğinin temel özellikleri ve hedefleri

(Vallejos, 2006) Veri madenciliğinin en önemli özellikleri şunlardır:

  • Veritabanlarının veya veri ambarlarının derinliklerinde bulunan verileri, zaman içinde çok fazla bilgi saklama eğiliminde oldukları için keşfedin. Bazı durumlarda, bu veritabanları veya veri ambarları veri pazarları haline gelir veya genellikle İnternet veya Intranet sunucuları Madenciliğin dış ortamı genellikle sunucu-müşteri ilişkisidir Veri madenciliği araçları, kurumsal arşivlerde veya kamu kayıtlarında gömülü olan bilgi cevherinin çıkarılmasına yardımcı olur Veri madenciliği bazı türleri üretir bilginin:
  • İlişkiler Sınıflandırmalar Diziler Tahminler Gruplamalar

Veri madenciliğinde veriler, bunlardan bazı hipotezlerin ortaya çıkması umuduyla seçilir ve veriler, neden oldukları gibi olduklarını açıklamak veya göstermek için aranır.

Daha sonra, hipotez doğrulanır ve bu nedenle veri madenciliği keşifsel bir yaklaşım sunmalıdır, ancak hipotezleri doğrulamak için veri belirlemenin kullanılması bir şekilde geçerli bir çıkarım yapıldığı için biraz tehlikelidir.

Datamining, birkaç alanı entegre eden ancak yazılımla karıştırılmaması gereken aşamalardan oluşan bir teknolojidir.

Şu anda, güçlü olan ve genellikle başka bir araçla tamamlanmış olsalar da projelerin geliştirilmesini kolaylaştıran bazı veri madenciliği uygulamaları veya araçları bulunmaktadır.

Datamining Sürecinin Aşamaları

Veri madenciliği birbirinden farklı olma eğiliminde olsa da, ortak veri madenciliği süreci dört ana aşamadan oluşur:

Hedeflerin belirlenmesi

Bu ilk aşama, müşterinin bir

veri madenciliği uzmanının rehberliğinde isteyebileceği hedeflerin sınırlandırılmasıyla ilgilenir.

Veri yeniden işleme

İkinci aşamada, temel olarak veri tabanlarının seçimi, temizlenmesi, zenginleştirilmesi, azaltılması ve dönüştürülmesini ifade eder, bu aşama genellikle bir veri madenciliği projesinin toplam süresinin yaklaşık yüzde yetmişini tüketir.

Modelin belirlenmesi

Üçüncü aşama, bu aşamada, verilerin istatistiksel bir analizini yapmaya başlar ve daha sonra bir yaklaşıma sahip olmak için grafiksel bir şekilde görselleştirilir.

Belirlenen hedeflere ve yapılacak görevlere bağlı olarak Yapay Zekanın farklı alanlarında geliştirilen bazı algoritmalar kullanılabilir.

Sonuçların analizi

Datamining projesinin aşamaları (Vallejos, 2006)

Son aşamada, elde edilen sonuçlar doğrulanır ve istatistiksel analizler ve grafiklerle karşılaştırılır.

Müşteri, yeni olup olmadıklarına ve karar vermelerine izin veren yeni bilgiler sağlayıp sağlamadıklarına karar vermelidir.

Kullanım Uygulamaları

Her yıl, farklı kongre ve çalıştaylarda, farklı uygulamalara sahip araştırmacılar bir araya gelerek, özellikle Amerika Birleşik Devletleri'nde, veri madenciliği kuruluşların, üniversitelerin, hükümetlerin, hastanelerin hayatına dahil edilmiştir ve çeşitli şirketler, temellerini keşfetmekle ilgilenmektedir. veri.

Hükümette

FBI, teröristleri tespit etmek için ticari veri tabanlarını analiz edecek.

Şirkette

  • Kredi kartı sahtekarlığının tespit edilmesini sağlar İnsanların neden bir cep telefonu şirketinden kaçtığını keşfedin Süpermarketlerdeki alışveriş alışkanlıklarını belirleyin Televizyon izleyicilerinin boyutunu tahmin edin

Kolejde

Bir üniversiteden yeni mezun olanların okuduklarıyla ilgili mesleki faaliyetler gerçekleştirip gerçekleştirmediğini bilmeyi sağlar.

Özel Soruşturmalarda

Nesneleri yüksek güvenilirlikle sınıflandırabilmek için gruplama tekniklerine ve karar ağaçlarına dayanan SKYCAT projesinin geliştirilmesi.

Spor kulüplerinde

NBA takımları, koçluk takımlarını desteklemek için akıllı uygulamalar kullanır. (Vallejos, 2006)

Sonuç

Veri madenciliği veya veri madenciliği, bu makalenin geliştirilmesinde gördüğümüz gibi, değerli olarak algıladıkları bir şeyi sunmalarına izin verdiği için müşteri sadakatini geliştirmeye hizmet eder, çünkü özelliklerinden biri, belirli bir pes etme eğilimi ile davranış kalıplarını belirlemektir. Bunu zaten yapmış olan müşterilerden gelen verilere dayanarak bırakın, böylece kuruluşlar her zaman bir adım önde olabilir ve müşterilerini elde tutmak için bazı teşvikler sunabilir.

İlaç, dolandırıcılığın önlenmesi ve kontrolü, terörizm, mühendislik ve genetik ile bağlantılı eylemlerin soruşturulması gibi bu tür bilgi analizi için birçok önemli uygulama alanı da vardır.

Veri madenciliği yapan kişiler, bunun temelde işle karıştırılmış istatistiklerden ibaret olduğunu söylüyor ve kullandığı yöntemlerin ve karşılaşabileceği sorunların onu benzersiz ve oldukça alakalı hale getirdiğini savunuyorlar.

Özetle veri madenciliği, araştırmacılar ve iş adamları arasındaki buluşma noktası gibi elbette çeşitli avantajlarla ortaya çıkan ve kuruma büyük miktarlarda para kazandırmanın yanı sıra yenilerini açmaya izin veren bir teknoloji olarak sunulmaktadır. iş fırsatları. Veri madenciliği ile çalışmanın o kadar çok ayrıntıya dikkat etmeyi gerektirdiği gerçeğine ek olarak, sonunda kesin kararlar almaya izin verir.

Referanslar

  • Durán Mena, C. (6 Ağustos 2014). Forbes Meksika. Https://www.forbes.com.mx/mineria-de-datos-informacion-precisa-y-relevante/Larrieta, MI ve Santillán Gómez, AM (2007) adresinden alınmıştır. EJournal UNAM. Veri Madenciliği'nden Mart 2016'da alındı: Kavram, özellikler, yapı ve uygulamalar: http://www.ejournal.unam.mx/rca/190/RCA19007.pdfRAE. (2014). Kraliyet İspanyol Akademisi. Http://dle.rae.es/srv/search? M = 30 & w = alacalı Sinnexus'tan alındı. (2007). İş Zekası Stratejik bilgi işlem. Mart 2016 tarihinde http://www.sinnexus.com/business_intelligence/datamining.aspxSQL Server adresinden erişildi. (2014). Microsoft. Https://msdn.microsoft.com/esmx/library/ms174949(v=sql.120).aspx Information Technology adresinden alınmıştır. (2009). Bilgi Sistemleri: Veri işleme, planlama ve kaynak yönetimi.Mart 2016 tarihinde http://www.tecnologias-informacion.com/mineria-de-datos.htmlVallejos, SJ (2006) adresinden erişildi. ExaUnne.edu. Mart 2016 tarihinde http://exa.unne.edu.ar/informatica/SO/Mineria_Datos_Vallejos.pdf adresinden erişildi.

Alacalı: Heterojen, belirsiz olmadan toplandı. (RAE, 2014)

Orijinal dosyayı indirin

Veri madenciliği