Logo tr.artbmxmagazine.com

Veri madenciliği kullanmanın avantajları

İçindekiler:

Anonim

Bilgi stratosferik miktarlarda ve skandal bir hızda üretilir, bilgi ve iletişim teknolojilerinin gelişiyle birlikte bilgiler pratik olarak yağar, dünyanın her yerinden şirketlerin bilgisayarlarına ve sunucularına ulaşır ve günümüzdeki depolama kapasitesi nedeniyle Bilgi, veri denizinde kaybolabilir, ancak tüm bu veriler kuruluşlar için yararlı değildir.

Bu nedenle depolanan ve gelen bilgilerin daha iyi işlenmesi için bilgi aramaya yardımcı olan araçların kullanılması gerekir, ancak bununla birlikte değil, aynı zamanda net ve kesin bilgilerin elde edilmesini sağlayan araçlara da sahip olmak gerekir. elde edilen verilerle daha iyi verimlilik.

Veri madenciliği, depolanan bilgilerden yararlanmak için bu görevleri yerine getirmeye yardımcı olan bir araçtır, ancak kullanımı tüm kuruluşların bildiği veya yaptığı bir şey değildir, çünkü benzer görevleri yerine getiren büyük veri gibi başka araçlar da vardır. ancak her birinin kendine has özellikleri vardır.

Bu makalede, veri madenciliğinin şirketlerin üretkenliğinde nasıl çok yararlı bir araç haline geldiğini görebilir ve aynı şekilde diğer araçlarla nasıl etkileşime girebileceğini, veri madenciliği kullanmanın faydalarını ve belirli özelliklerini göreceğiz.

Tanımlar.

Göre (wikipedia.org, 2018) veri madenciliği aşağıdaki anlama gelir:

Yapay zeka, makine öğrenimi, istatistik ve veritabanı sistemleri yöntemlerini kullanır. Veri madenciliği sürecinin genel amacı, bir veri kümesinden bilgi çıkarmak ve daha sonra kullanılmak üzere anlaşılır bir yapıya dönüştürmektir. Ham analiz aşamasına ek olarak veri ve veritabanı yönetimi yönlerini de içerir, veri işleme, model ve çıkarım konuları, ilgi ölçütleri, hesaplama karmaşıklığı teorisi konuları, keşfedilen yapıların son işlemleri, görselleştirme ve çevrimiçi güncelleme.

(Marqués, 2014) tarafından verilen bir başka tanım bize veri madenciliğinin şu olduğunu söyler:

Veri madenciliği, büyük veri kümelerinden eyleme geçirilebilir bilgileri keşfetme sürecidir. Verilerde var olan kalıpları ve eğilimleri çıkarmak için matematiksel analizi kullanın. Tipik olarak, bu modeller geleneksel veri keşfi ile tespit edilemez çünkü ilişkiler çok karmaşıktır veya çok fazla veri vardır.

Bu modeller ve eğilimler, bir veri madenciliği modeli olarak toplanabilir ve tanımlanabilir. Veri madenciliği modelleri aşağıdaki gibi senaryolarda uygulanabilir:

  • Tahmin: satışları hesaplama ve sunucu yüklerini veya sunucu kapalı kalma süresini tahmin etme Risk ve olasılık: doğrudan posta dağıtımı için en iyi istemcileri seçme, risk senaryoları için olası başa baş noktasını belirleme ve Olasılıkların teşhislere ve diğer sonuçlara atanması Öneriler: birlikte satılabilecek ürünlerin belirlenmesi ve önerilerin oluşturulması Sıra arama: müşterilerin alışveriş sepetine yerleştirdiği öğelerin analizi ve olası olayların tahmini. Gruplama: müşterilerin veya olayların ilgili öğe gruplarına dağıtımı ve yakınlıkların analizi ve tahmini. (microsoft.com, 2018)

Veri madenciliğinin ana aşamaları.

Veri madenciliğinin, gelecekteki karar vermede bize değerli bilgiler sağlayabilecek kalıpları bulmak için büyük veri tabanlarını keşfetmeye izin veren teknikler ve teknolojiler dizisi olduğu söyleniyor. Veri madenciliği sürecinin tipik olarak dört ana aşaması vardır:

  • Hedeflerin belirlenmesi Veri işleme Modelin belirlenmesi Sonuçların analizi

Adımların ilki, müşterinin veritabanından çıkarmak istediği bilgi türüyle ilgilidir. İkinci aşama, müşterinin bize sağladığı veritabanını seçmek, temizlemek, zenginleştirmek, azaltmak ve dönüştürmek zorunda olduğu için daha fazla çalışma gerektiren aşamadır. Bunu işledikten ve yapay zeka algoritmasını uygulamaya hazır olduktan sonra, hangi algoritmanın bize en iyi sonuçları vereceğini seçmemiz gerekiyor.

Belirli bir analitik görev için en iyi algoritmayı seçerken, bu büyük bir zorluktur ve çözülecek probleme bağlıdır. Veri madenciliğinde temel olarak beş farklı sorun vardır: sınıflandırma, regresyon, bölümleme, ilişkilendirme ve dizi analizi.

Bu problemleri çözmek için kullanılacak birçok algoritma vardır, bunlardan başlıcaları şunlardır: ilişkilendirme, kümeler, karar ağacı, doğrusal regresyon, saf Bayes sınıflandırıcı, sinir ağı, dizi ve seri kümeleri. geçici.

Son olarak, son adım, sonuçları analiz etmektir. Şu anda bu çalışma, veri güvenliği, finans, sağlık, pazarlama, dolandırıcılık tespiti, çevrimiçi aramalar, doğal dil işleme veya yeni akıllı arabalar gibi birçok iş alanında yapılıyor. (veryinteresting.es)

Veri Madenciliği ve Büyük Veri Entegrasyonu.

Veri Madenciliği, bilginin çıkarılmasına yönelik bir dizi teknikten oluşur ve Büyük Veri, bu verileri makul bir sürede ve doğru bir şekilde yakalayabilen, yönetebilen ve işleyebilen bir teknolojidir. Veri Madenciliği, Büyük Verinin veri işleme ve yönetimini düzene sokmasını gerektirir ve aynı zamanda Büyük Veri, öngörücü veri analizi ve eğilimleri tespit etmek için Veri Madenciliği gerektirir. Teknik ve alet arasında karşılıklı bir entegrasyon olduğunu söyleyebiliriz.

Büyük Veri teknolojisi, bunlardan yararlanarak büyük miktarda veriyi hızlı ve doğru bir şekilde yakalayabilir, depolayabilir, yönetebilir ve işleyebilir.

Temel olarak, veri madenciliği de dahil olmak üzere farklı teknikler kullanarak tahmine dayalı analiz ve trendleri tespit etmeye odaklanır. Modellerin tanımlanması ve farklı teknolojilerin kullanılmasıyla amaç, verileri değerli bir varlığa dönüştürmektir.

Bu teknolojiyi kullanarak, yeni pazar nişleri bulmak, mevcut veya gelecekteki müşterilerle ilgili temel özellikleri tanımlamak, parametreler, ölçümler veya süreçler oluşturmak için kullanılabilecek ortak kalıpları belirleyebiliriz.

Birçok durumda şirketlerin karlılığını ve üretkenliğini artıran, iş yapma biçiminde bir dönüşümden oluşur.

Veri Madenciliği çok yönlüdür ve geleneksel bir analiz yapmak için kullanılabileceği gibi, Büyük Veriden değer elde etmek için iyi bir kaynaktır. İkisinin kombinasyonu, her iki aracın daha da büyük potansiyele sahip olmasını sağlar. (Balagueró, 2017)

Veri madenciliği ve Büyük Veri uygulama örnekleri.

Büyük Veri ve Veri Madenciliği farklı işlevlere sahip olduğundan ve bu nedenle farklı bağlamlar için uygulandığından, uygulama kapsamlarının bazı örneklerini göreceğiz.

Waltt Disney, müşterilerinin rotalarını analiz etmek ve deneyimlerini gerçek zamanlı olarak iyileştirmek için Büyük Veriden yararlanarak kullanıcıların veya tüketicilerin daha iyi anlaşılmasını sağladı.

Veri Madenciliği, şüpheli davranış kalıplarını keşfetmek ve keşfetmek için bilgileri analiz eder. Bakteriler arasında davranış kalıpları oluşturmak için bankacılık veya mikrobiyoloji çalışmalarında dolandırıcılık veya dolandırıcılıkla bağlantılı davranış kalıplarını analiz ederek, suç davranış kalıplarının araştırılmasında uygulanabilir. (Balagueró, 2017)

Veri madenciliği döngüsü

  1. Bilgi kullanıcıları, verilerin şirkete değer katabileceği iş sorunlarını ve alanları belirlemelidir. Aynı şekilde, bilginin çok değişken olduğu, ancak şirketin rekabet gücü için gerekli olan alanların belirlenmesi önemlidir. Bunun için çeşitli kriterler ele alınabilir ve doğru olarak adlandırılabilecek belirli kriterler yoktur. Amaç, veri madenciliği süreci için girdi görevi görecek kriterleri, fikirleri, normları ve soruları belirlemektir.Geçmiş bilgileri analiz etmek için, kullanıcı uygun madencilik algoritmasını veya algoritmalarını seçecektir. Daha sonra bu algoritmalar, aramaları önceden tanımlanan kriterlere göre yapacak madencilik programlarına çevrilir.Veri madenciliği sürecinden elde edilen bilgileri karar verme sürecine dahil edin; elde edilen bilgilerin şirketin süreçlerine entegre edilebilmesi ve problemlerin çözümünde uygulanabilmesi için bulunan bulguların operasyonlardan sorumlu olanlara sunulmasının yanı sıra sonuçları ölçün: Bulunan bulguların değerini ölçün belirlenen sorunların çözümü ve ilk maddede tanımlanan kriterler ile ilgili karar vericiye.belirlenen sorunların çözümü ve ilk maddede tanımlanan kriterler ile ilgili olarak karar vericiye sağlanan.belirlenen sorunların çözümü ve ilk maddede tanımlanan kriterler ile ilgili olarak karar vericiye sağlanan.(Lagunés, 2016).

Metin madenciliği

Metin madenciliği, dilin doğal metninden anlamlı bilgiler çıkarmaya çalışan yeni ortaya çıkan bir alandır. Genel olarak, belirli amaçlar için yararlı olan bilgileri çıkarmak için metni analiz etme süreci olarak nitelendirilebilir. Veritabanlarında depolanan veri türleriyle karşılaştırıldığında, metin yapılandırılmıştır, şekilsizdir ve algoritmik olarak işlenmesi zordur. Bununla birlikte, modern kültürde metin, resmi bilgi alışverişi için en yaygın araçtır. Metin madenciliği alanları genellikle işlevi olguların, bilgilerin veya fikirlerin iletişimi olan metinlerle ilgilenir ve söz konusu metinden otomatik olarak bilgi çıkarmaya çalışma motivasyonu, başarı sadece kısmi olsa bile ikna edicidir..

"Metin madenciliği" ifadesi genellikle büyük miktarlarda metin ve doğal dili analiz eden ve olası yararlı bilgileri elde etme girişiminde sözcüksel veya dilbilimsel kullanım modellerini tespit eden herhangi bir sisteme atıfta bulunmak için kullanılır. (Ramírez, 2016)

Veri madenciliğini kullanmanın diğer bilgi yönetimi tekniklerine göre avantajları.

  • Veri madenciliği, kuruluşların veri tabanlarında yer alan bilgileri yönetme ihtiyaçlarından doğar, bu prosedür, bilgi yönetimi için kullanılan diğer süreçlere göre bir dizi avantaja sahiptir: iş liderleri, çoğu durumda kuruluş içinde var olduğu bilinmeyen bir dizi ilişki ve bilgi Veri madenciliği, şirketlerin şirketlerin gidişatını takip edecekleri yolları seçmelerine ve avantaj elde etmelerine yardımcı olur Veri madenciliği bilgilerinin kullanılması yoluyla yalnızca şirketin münhasıran bildiği bilineceğinden, pazar rakiplerine karşı rekabet edebilir.Bizler insanlar olarak kalıpları ve anormallikleri yüzeysel bir şekilde tespit etme yeteneğine sahibiz, tabiri caizse, bu nedenle veri madenciliği yoluyla çıplak gözle tespit edilmesi zor olan kalıpları daha iyi bir şekilde algılamak mümkün olacak. basit takdir.(Franco, 2016)

Veri madenciliği ve diğer disiplinler.

Veri madenciliği ile istatistik, yapay zeka gibi benzer disiplinler arasında belirli sınırlar vardır. Bazıları, veri madenciliğinin, onu satılabilir bir ürüne dönüştüren iş jargonuna sarılmış istatistiklerden başka bir şey olmadığını savunuyor. Öte yandan diğerleri, onu diğer disiplinlerden farklı kılan bir dizi özel problem ve yöntem bulur.

Gerçek şu ki, pratikte, veri madenciliğinde genel olarak kullanılan tüm modeller ve algoritmalar - sinir ağları, regresyon ve sınıflandırma ağaçları, lojistik modeller, temel bileşen analizi, vb. - nispeten uzun bir geleneğe sahiptir. diğer alanlar. (wikipedia.org, 2018)

İstatistiklerden.

Kuşkusuz, veri madenciliği, aşağıdaki teknikleri aldığı istatistiklerden yararlanır:

  • Farklı popülasyonlardaki bir veya daha fazla sürekli değişkenin ortalamaları arasında önemli farklılıkların varlığının değerlendirildiği varyans analizi Regresyon: Bir veya daha fazla değişken ile ilk değişkenlerin bir dizi öngörücü değişkenleri arasındaki ilişkiyi tanımlar Ki-test. kare: değişkenler arasındaki bağımlılık hipotezinin test edildiği yer. Kümeleme analizi: Belirli sayıda grupta birden çok özellik (ikili, nitel veya nicel) ile karakterize edilen bireylerin bir popülasyonunun sınıflandırılmasına izin verir, bireylerin benzerlik veya farklılıklarına göre Ayrımcı analizi: Bireylerin daha önce oluşturulmuş gruplar halinde sınıflandırılmasına, bu grupların elemanlarının sınıflandırma kuralının bulunmasına olanak sağlar,ve bu nedenle, grup üyeliğini tanımlayan değişkenlerin daha iyi tanımlanması Zaman serileri: bir değişkenin zaman içindeki evriminin, bu bilgiye dayalı olarak ve varsayımları altında tahminler yapmak için incelenmesine izin verir. yapısal değişiklik olmayacak.(wikipedia.org, 2018)

Bilgi işlem.

Hesaplamadan şu teknikleri kullanır:

  • Genetik algoritmalar: Optimize edilecek değişken veya değişkenlerin çalışma değişkenleri ile birlikte bir bilgi segmentini oluşturduğu sayısal optimizasyon yöntemleridir. Yanıt değişkeni için daha iyi değerler elde eden analiz değişkenlerinin bu konfigürasyonları, daha büyük üreme kapasitesine sahip segmentlere karşılık gelecektir. Üreme yoluyla, en iyi segmentler ayakta kalır ve oranları nesilden nesile büyür. Değişkenleri (mutasyonları) değiştirmek için rastgele öğeler de tanıtabilirsiniz. Belli sayıda yinelemeden sonra, kötü çözümler atıldığından, yinelemeden sonra yinelemeden, popülasyon optimizasyon sorununa iyi çözümlerden oluşacaktır. Yapay Zeka:Akıllı bir sistemi simüle eden bir bilgisayar sistemi kullanılarak mevcut veriler analiz edilir. Yapay Zeka sistemleri arasında Uzman Sistemler ve Sinir Ağları çerçevelenecektir Uzman Sistemler: Uzmanların bilgisinden elde edilen pratik kurallardan oluşturulmuş sistemlerdir. Temelde çıkarımlara veya neden-sonuçlara dayanır. Akıllı Sistemler: Uzman sistemlere benzerler, ancak uzman tarafından bilinmeyen yeni durumlarda daha büyük avantajlara sahiptirler. Sinir ağları: Genel olarak, değişkenler, çıktılar elde edilinceye kadar doğrusal veya doğrusal olmayan dönüşümler aracılığıyla etkileşime girer. Bu çıktılar, test verilerine dayalı olarak bırakılması gerekenlerle karşılaştırılır,uygun bir model elde edilene kadar ağın yeniden yapılandırıldığı bir geri bildirim sürecine yol açar.(wikipedia.org, 2018)

Veri madenciliği yaparak, verilerinizi geleneksel sorgu yöntemlerini kullanmaktan çok daha karmaşık bir şekilde sorgulayabilirsiniz. Sağladığı bilgi madenciliği, işle ilgili karar vermenin kalitesini ve güvenilirliğini önemli ölçüde artırabilir.

Örneğin, geleneksel yöntemler bir bankaya hangi tür banka hesabının en karlı olduğunu söyleyebilir. Bunun yerine, veri madenciliği bankanın zaten bu tür bir hesaba sahip müşterilerin profillerini oluşturmasına izin verir. Banka daha sonra bu profile uyan diğer müşterileri bulmak için veri madenciliğini kullanabilir ve böylece özellikle bu müşterileri hedefleyen bir pazarlama kampanyası başlatabilir.

Veri madenciliği, bir süpermarketin satın alma kayıtları gibi şirket verilerindeki kalıpları belirleyebilir. Örneğin, müşteriler A ve B ürünlerini satın alırsa, büyük olasılıkla hangi C ürününü de satın alırlar? Bu gibi soruları doğru yanıtlamak, iş stratejileri oluşturmada paha biçilmez bir yardımcıdır.

Veri madenciliği, bilinen bir müşteri grubunun, örneğin kredisi zayıf olan müşterilerin özelliklerini belirleyebilir. Şirket daha sonra bu özellikleri kullanarak yeni müşteriler seçebilir ve onların da düşük kredisi olup olmayacağını tahmin edebilir. Veri madenciliği araçları, büyük veri tabanlarında bu tür bilgileri keşfetmeyi kolaylaştırır ve otomatikleştirir. (ibm.com)

Sonuç.

Bilgi şirketler için önemli bir varlık haline geldi, son zamanlarda Facebook, bu şirketin bilgileri işlemesine izin verdiği için Cambridge analytica örneğine atıfta bulunarak, kullanıcılarının bilgilerinin kötü yönetilmesinden kaynaklanan çok ciddi bir soruna daldı. tüm kullanıcı verileri, o zamanki aday Donald Trump için daha iyi bir kampanya yürütmek amacıyla.

Bu ciddi sorun, şirketin sahibi (facebook) Mark Zuckerberg'in Amerika Birleşik Devletleri Kongresi'ne neden böyle bir şeye izin verdiğini beyan etmesine neden oldu, başvurmak istediği şey bugün üretilen bilgidir. Çok değer taşıyor, çok ağır çünkü ITC'lerin gelişiyle organizasyonlar bilgi bombardımanına uğruyor.

Bugün üretilen o kadar çok bilgi var ki, onu idare edebilecek yapay zeka geliştirilmeli, örneğin google'da veya Google'da üretilen bilgileri daha sofistike ve verimli bir şekilde işleyebilen sinir ağları yapılmıştır. youtube, çünkü kullanıcıları milyarı aşıyor.

Kuşkusuz, veri madenciliği bilginin ürettiği ağırlığın bir kısmını desteklemeye başlamıştır, ancak bilginin nasıl işlendiğine ve kiminle işlemesine izin verdiğimize her zaman dikkat etmeliyiz.

Tez önerisi.

Öğrencileri bünyelerine dahil edebilmek için veri madenciliği konusunda uzmanlaşmış şirketlerle anlaşmalar yapın.

Genel hedef.

Öğrencilerin veri madenciliği yönetimi ile ilgili proje veya çalışmalar yürütmesi ve daha hazırlıklı olmak için bu konuyu daha fazla ıslatması.

Teşekkürler.

Her gün devam etme gücü olan ve beni bulunduğum yere ulaştıran anneme, çalışmalarıma devam etmem için bana zamanlarını ve bilgilerini veren öğretmenlerime, o zamandan beri Dr. Fernando Aguirre ve Hernández'e teşekkür ediyorum. Ustalık maceramızda ilerlememiz için bizi motive etmek için bize desteğini verdiği için bize Yönetim Mühendisliğinin Temelleri konusundaki tüm deneyim ve bilgisini ve CONACYT'e verdi.

Kaynakça.

Balagueró, T. (1 Kasım 2017).

26 Mayıs 2018 tarihinde https://www.deustoformacion.com adresinden erişildi:

Franco, LG (6 Nisan 2016). https://www.gestiopolis.com. 26 Mayıs 2018'de https://www.gestiopolis.com adresinden alındı:

www.gestiopolis.com/mineria-datos-textos/

ibm.com. (Sf). https://www.ibm.com. 26 Mayıs 2018 tarihinde https://www.ibm.com adresinden erişildi: https://www.ibm.com/support/knowledgecenter/es/SSEPGG_10.5.0/com.ibm.im.ov erview.doc / c_dm_goals.html

Lagunés, XA (2 Haziran 2016). https://www.gestiopolis.com. Tarihinde kurtarıldı

26 Mayıs 2018, https://www.gestiopolis.com adresinden:

www.gestiopolis.com/mineria-datos-informacion/

Marqués, P. (2014). ÖRNEKLERLE VERİ MADENCİLİĞİ. İspanya:

  1. Kitabın.

microsoft.com. (1 Mayıs 2018). https://docs.microsoft.com. 26 Mayıs 2018 tarihinde https://docs.microsoft.com adresinden erişildi: https://docs.microsoft.com/eses/sql/analysis-services/data-mining/data-mining-concepts?view=sql -analysisservices-2017

veryinteresante.es. (Sf). https://www.muyinteresante.es. 26 tarihinde alındı

Mayıs 2018, https://www.muyinteresante.es adresinden:

www.muyinteresante.es/tecnologia/preguntas-respuestas/que-es-la-mineriade-datos-311477406441

Ramírez, AA (21 Eylül 2016).

26 Mayıs 2018 tarihinde https://www.gestiopolis.com adresinden erişildi:

wikipedia.org. (27 Nisan 2018). https://es.wikipedia.org. 26 tarihinde alındı

Mayıs 2018, https://es.wikipedia.org adresinden:

es.wikipedia.org/wiki/Miner%C3%ADa_de_datos

Veri madenciliği kullanmanın avantajları