Logo tr.artbmxmagazine.com

Veri madenciliği. teknolojiyi avantajımıza kullanmak

İçindekiler:

Anonim

GİRİŞ

(Riquelme, Ruiz ve Gilbert, 2006) dijital devrimin sayısallaştırılmış bilginin yakalanması, işlenmesi, depolanması, dağıtılması ve iletilmesini kolaylaştırdığını belirtmektedir. Bilgi işlem ve ilgili teknolojilerdeki önemli ilerleme ve yaşamın farklı yönlerinde kullanımlarının yaygınlaşmasıyla birlikte, büyük miktarda bilgi toplanmaya ve veritabanlarında depolanmaya devam ediyor.

Bu nedenle, kuruluşların müşterilerle kalıcı ilişkiler sürdürmek gibi bugün var olan zorluklarla yüzleşmek için bu tür teknolojiyi kendi yararlarına kullanmaları önemlidir. (Braga, Valencia ve Carvajal, 2009), kuruluşların bugün karşılaşabileceği en büyük zorluğun kazançlı bir müşteri portföyü sürdürmek olduğunu, artık üretimi organize etmek, maliyetleri azaltmak veya sağlanan bakımla ilgili olmadığını belirtmektedir. Gerekli koşullar olmalarına rağmen, son derece rekabetçi küresel pazarda kazanmak için artık yeterli değiller.

Yazarlar, kuruluşların hedeflerini, beklentilerini ve isteklerini yorumlayabilmesinin müşteriler hakkında edinilen bilgiler aracılığıyla olduğunu öne sürüyorlar. Bunun, "veri madenciliği" veya tekniklerin bir koleksiyonu olan "müşteri merkezli veri madenciliği" ile gerçekleştirilebileceğini öne sürüyorlar (Braga ve diğerleri, 2009). Pazarın bir şirkete (pazar payı) uyan kısmının satın alınmasını ve elde tutulmasını kolaylaştıran yöntemler. İyi bakım ve maliyet düşürme hedefleri, hükümet olsun veya olmasın kar amacı gütmeyen kuruluşlar için de geçerlidir. Müşterilerini tanıyan işletme onlara daha da iyi hizmet verecek.

Bu makale, veri, metin ve duyarlılık madenciliğinin hangi verileri içerdiğini ve kuruluşların bu tür teknolojiyi yalnızca diğer kuruluşlara göre rekabet avantajı elde etmek için değil, aynı zamanda ürünlerine daha iyi odaklanmak için nasıl kullanabileceğini açıklayacaktır. ve / veya tüketicilerinden ve müşterilerinden elde edilen bilgilerin hizmetleri.

VERİ MADENCİLİĞİ

(Braga ve diğerleri, 2009), veri madenciliğinin, yalnızca insan sezgisine dayalı bir analizin önyargısı ve sınırlaması olmaksızın, verilerdeki kalıpları keşfetmek için otomatik bir yöntem sağladığını açıklar.

Ayrıca, müşteri odaklı veri madenciliğinin müşterilerin özellikleri ve davranışları hakkında bilgi sağladığını da açıklıyorlar. Çünkü müşterileri elde tutmak, yenilerini elde etmekten daha ucuzdur.

Yazarlar, veri madenciliğinin geniş veri yığınlarından açıklama ve tahmin için bir dizi teknik içerdiğini açıklamaktadır. Bu nedenle genellikle özellikle “veri ambarı” olarak adlandırılan veritabanları ile ilişkilendirilir. Bu veritabanları, farklı kaynaklardan gelen verilerin hızlı entegrasyonuna izin verir.

(Joyanes, 2016) veri madenciliğinin bir veritabanında, veri ambarında veya veri mağazasında değerli iş bilgilerinin aranması sürecini ifade ettiğini savunuyor.

Veri madenciliği iki temel işlemi gerçekleştirebilir:

  • Eğilimleri ve davranışları tahmin etme Daha önce bilinmeyen kalıpları tanımlama. Normal İş Zekası uygulamaları genellikle kullanıcılara ne olduğuna dair içgörü sağlar, veri madenciliği neler olduğunu açıklamaya yardımcı olur ve gelecekte ne olacağını tahmin eder.

Veri madenciliği, büyük veri tabanlarından, veri ambarından veya veri pazarından bilgiye dönüşen yararlı bilgileri çıkarmak ve tanımlamak için istatistiksel, matematiksel, yapay zeka ve makine öğrenimi tekniklerini kullanan bir süreçtir.

(Pérez, 2007) veri madenciliğini büyük miktarda veriyi inceleyerek yeni ve önemli ilişkileri, modelleri ve eğilimleri keşfetme süreci olarak tanımlar.

(Riquelme ve diğerleri, 2006), veri tabanlarında (KDD) bilgi keşfinin bir kullanıcı için geçerli, yeni, potansiyel olarak yararlı ve anlaşılabilir olan verilerdeki önemli kalıpları belirleme süreci olarak tanımlandığını ve bu süreç Aşağıdaki adımları içeren etkileşimli ve yinelemelidir:

  1. Uygulama alanını anlayın: Bu adım, ilgili önceki bilgileri ve uygulama hedeflerini içerir Hedef veritabanını çıkarın: verileri toplayın, verilerin kalitesini değerlendirin ve aşina olmak için verilerin keşif analizini kullanın. Verileri hazırlayın: veri temizleme, dönüştürme, entegrasyon ve azaltmayı içerir. Daha sonra uygulanan öğrenme algoritmasının gerektirdiği süre azaltılırken verilerin kalitesi iyileştirilmeye çalışılır Veri Madenciliği: Yukarıda belirtildiği gibi, bu sürecin temel aşamasıdır. Aşağıdaki işlevlerden biri veya birkaçından oluşur: sınıflandırma, regresyon, kümeleme, özet, görüntü alma, kural çıkarma, vb. Yorum: Keşfedilen kalıpları ve bunları görselleştirme olasılığını açıklayın.Keşfedilen bilgiyi kullanın: oluşturulan modelden yararlanın

KDD'nin temel aşamasını görselleştirebildiğimiz için veri madenciliği, bu nedenle aşağıda işlevlerinin nelerden oluştuğunu açıklayacağız:

  • Sınıflandırma: önceden tanımlanmış kategorik sınıflar içindeki bir veriyi sınıflandırır. Regresyon: Bu modelin amacı, bir veriyi bir değişkenin gerçek değeriyle eşleştirmektir. Kümeleme: Nesne sınıflarındaki kayıtların, gözlemlerin veya durumların gruplandırılmasını ifade eder Benzer. Küme, başka bir kümedeki kayıtlara benzer ve bunlardan farklı kayıtların bir koleksiyonudur.Kural Oluşturma - Burada, verilerden kurallar çıkarılır veya oluşturulur. Bu kurallar, farklı öznitelikler arasındaki ilişki ilişkilerinin ve işlevsel bağımlılıkların keşfine atıfta bulunur. Özet veya özet: bu modeller, bir veri alt kümesinin kompakt bir tanımını sağlar. Sıra analizi: Zaman varlıklarının analizi, diziler gibi sıralı modeller modellenir genlerin vb.Amaç, sürecin durumlarını modellemek veya zaman içindeki sapma ve eğilimleri çıkarmak ve raporlamaktır.

VERİ MADENCİLİĞİ UYGULAMALARI

(Riquelme ve diğerleri, 2006), veri madenciliğinin önemli görevlerinden bazılarının, mevcut teknikler için uygulamaların tanımlanmasını ve elektronik ticaret ve biyoinformatik gibi geleneksel veya yeni uygulama alanları için yeni teknikler geliştirmeyi içerdiğini belirtmektedir.

Veri madenciliğinin uygulanabileceği alanlar, aşağıdakiler gibi veri üreten tüm insan faaliyetlerindedir:

  • Ticaret ve bankacılık: müşteri segmentasyonu, satış tahmini, risk analizi Tıp ve Eczacılık: hastalıkların teşhisi ve tedavilerin etkinliği Güvenlik ve dolandırıcılık tespiti: yüz tanıma, biyometrik tanımlamalar, ağlara erişime izin verilmiyor, vb. Sayısal olmayan bilgi erişimi: metin madenciliği, web madenciliği, görüntü, video, ses ve metin arama ve multimedya veritabanlarından tanımlama Astronomi: yeni yıldızların ve galaksilerin belirlenmesi Jeoloji, madencilik, tarım ve balıkçılık: alan tanımlama Uydu görüntüsü veri tabanlarında farklı mahsuller veya balıkçılık veya madencilik istismarı için kullanım Çevre Bilimleri: gözlemlerini, yönetimlerini ve / veya kontrollerini iyileştirmek için doğal ve / veya yapay ekosistemlerin işleyen modellerinin belirlenmesi Sosyal Bilimler:Kamuoyu akışlarının incelenmesi. Şehir planlaması: sosyodemografik değerlere dayalı çatışmalı mahalleleri belirlemek.

METİN MADENCİLİĞİ

(Matallana ve Delgado, 2010) metin madenciliğinin, yapılandırılmış olsun ya da olmasın büyük bilgi havuzlarından ve metin biçiminde bilgi çıkarılmasına izin veren belirli bir veri madenciliği biçimi olduğunu düşünmektedir. Amaç, veri madenciliğine benzer, görünmez davranış kalıplarını ve bir belgesel koleksiyonunda yeni bilgileri keşfetmektir.

Metin madenciliği, matematiksel ve istatistiksel tekniklerin yanı sıra metnin anlamsal analizini de uygular. Metin madenciliği, yapılandırılmış ve yapılandırılmamış bilgilerden yararlı bilgiler oluşturmak için metin verilerini analiz etmek ve yapılandırmak için otomatik yöntemler uygulama sürecidir.

Bu yazarlara göre metin madenciliği, bir dizi metinde ilginç kalıpların ve yeni bilgilerin keşfedilmesine odaklanır; amacı, büyük hacimli metinsel bilgi içinde yeni eğilimleri, sapmaları ve ilişkileri keşfetmektir.

(Joyanes, 2016), metin madenciliğini araştırdığını, madenciliği yaptığını ve her türden belgede metni keşfettiğini açıklar, buna metin veri madenciliği de denir, yazar, pratik bir anlamın, yüksek kaliteli bilginin belirli bir metnin.

Metin analizi, daha iyi karar vermeyi kolaylaştıran bir dizi metin içinde kalıplar bulmaya çalışır, amacı karar vermeyi iyileştirmektir. Metin analizi, yapılandırılmamış, işlenmiş verileri yakalamayı ve ondan analiz ve raporlama süreçlerinde kullanılabilecek yapılandırılmış veriler oluşturmayı amaçlamaktadır.

(Joyanes, 2016) metin verilerinin endüstride olduğu kadar hemen hemen tüm organizasyonlarda ve şirketlerde büyük bir etki potansiyeline sahip olduğunu savunmaktadır. Yakalamalara, ayrıştırmaya ve son metin analizine izin veren öğrenme yöntemleri kuruluşlar için kritiktir.

MADENCİLİĞİ HİSSETMEK

(Joyanes, 2016) duyarlılık madenciliğinin metin mesajlarında ve diğer medya formatlarında mevcut olan duyguların ve fikirlerin analizine odaklandığını ve örneğin metin mesajlarında gömülü olan görüşü veya duyguyu keşfetmeye izin verdiğini savunuyor. twitter gönderilerinde vb. hissedarlar ve onu oluşturan işçiler için somut bir fayda.

Bilindiği üzere fikir veya duygu madenciliği, maddi kaynaklardan öznel bilgileri tanımlamak ve çıkarmak için doğal dil işleme, hesaplamalı dilbilim ve metin analitiğini ifade eder.

Klasik duygu analizi, Web 2.0'ın piyasaya sürülmesinden ve blogların ve sosyal ağların artan kullanımından bu yana dramatik bir değişikliğe uğradı. Duygu analizini ölçen bir web uygulaması “twitter duyarlılığı” dır. Duygu analizi artık metin analizinin popüler bir kullanımıdır, piyasanın ne söylediği, düşündüğü ve hissettiği hakkında bilgi veren çok sayıda insandan genel görüş yönünü inceler ve alır. kuruluş veya kişi. Duygu analizi, sosyal medya sitelerinden alınan verileri kullanır.

Bir kuruluş veya şirket perspektifinden bakıldığında, duyarlılık analizi, bir marka veya ürün hakkında söylenenleri hızlı ve verimli bir şekilde analiz etmenize, belirli etkili kullanıcıların görüşlerini veya konuşmalarını takip etmenize, İnternet'teki eğilimleri tespit etmenize vb. Olanak tanır.

(Joyanes, 2016), duygu analizinin insan duygularını verilere dönüştürmeye çalışan bir yöntem olduğunu, ancak modern araçların kullanılmasıyla sosyal medyadaki düşüncenin kendiliğindenliği ve yakınlığının bu duyguları haline getirmesinin mümkün olduğunu belirtmektedir. daha otantik ve duygusal içeriklerini koruyor. Yapılandırılmamış içerikle ilgili analiz, aşağıdaki temel özelliklerle ölçülebilir:

  1. Kutupluluk: bir görüş konusunda olumlu, olumsuz ve hatta tarafsız.
  1. Yoğunluk: ifade edilen duygu derecesi Öznellik: ifadeyi yayan kaynak nesnel, kısmi veya tarafsızdır.

Duygu madenciliğinin farklı uygulamaları olabilir, örneğin:

  • Çalışan memnuniyetinin ve çalışma ortamının ölçülmesi Müşteri memnuniyetinin ölçülmesi Olası müşterinin terk edilmesi olarak yorumlanan olumsuz görüşleri tespit ederek müşteri kaybı riski durumlarını tespit ederek müşteri kaybını önleyin. markanın, firmanın, ürünlerin rekabeti hakkındaki görüşlerini değerlendirerek rekabet… ve bizimkiyle karşılaştırarak Organizasyonumuzun farklı alanlarındaki güçlü ve zayıf yönleri, olumlu veya olumsuz etki görüşlerini tespit ederek tespit etmek. kurumsal itibar Belirli eylemlerin, ürün lansmanlarının vb. evriminin tahmini. Siyasi oylar durumunda seçmenlerin görüşlerinin analizi.

Duygu analizi, diğer tekniklerin yanı sıra doğal dil işleme (NLP), yapay zeka ve metin madenciliği çerçevesinde çerçevelenmiştir, çünkü temelde bir tweet, bir blog yazısı gibi bir metinden öznel bilgileri çıkarmaya çalışır., vb.

TEŞEKKÜRLER

Tanrı'ya tüm nimetleri ve kendimi geliştirme sürecinde çalışma fırsatı için şükrediyorum. Bu yeni macerada beni her zaman destekledikleri için aileme, lisansüstü çalışmalarıma verdikleri destek için Ulusal Bilim ve Teknoloji Konseyi'ne, Orizaba Teknoloji Enstitüsü'ne, İdari Mühendislik Yüksek Lisansına ve Temeller konusuna teşekkür ederim. Meslek ve insan olarak daha iyi olabilmem için gerekli temelleri sağlamak için İşletme Mühendisliği Bölümü'nü üstlendi.

DANIŞILAN REFERANSLAR

  • Braga, LPV, Valencia, GİL ve Carvajal, SS (2009). Veri madenciliğine giriş. Rio de Janeiro: Editora E-makaleler, Joyanes, LA (2016). Büyük Veri, Organizasyonlarda büyük hacimli verilerin analizi. Alfaomega Grupo Editörü.Matallana, FE ve Delgado, JMC (2010). Büyükten küçüğe: Orta ölçekli şirketlerin erişimindeki büyük şirketlerin stratejileri. Netbiblo Pérez, CL (2007). Veri madenciliği: teknikler ve araçlar. Editoryal Paraninfo.Riquelme, JC, Ruiz, R., & Gilbert, K. (2006). Veri Madenciliği: Kavramlar ve Eğilimler. Yapay zeka. Ibero-American Journal of Artificial Intelligence, 10 (29). Http://www.redalyc.org/resumen.oa?id=92502902 adresinden kurtarıldı
Orijinal dosyayı indirin

Veri madenciliği. teknolojiyi avantajımıza kullanmak