Logo tr.artbmxmagazine.com

Veri, metin ve duygu madenciliği. organizasyonlarda büyük veri

İçindekiler:

Anonim

GİRİŞ

Kuşkusuz insan ırkının sahip olduğu en değerli değer, yıllar içinde farklı şekillerde saklanan bilgidir.

Bugün bu bilgi, artık yalnızca depolanmayan, aynı zamanda sonuç elde etmek için analiz edilen veri veya bilgi adıyla da biliniyor.

Geleceği tahmin etmek ve karar vermeyi kolaylaştırmak için veri, metin ve duyarlılık madenciliği kavramları bu şekilde doğdu.

Veri madenciliği kavramları, metinler ve duygular günümüz toplumunda büyük miktarda bilginin varlığından dolayı ortaya çıkan konulardır, bu kavram eğitim gibi günlük yaşamın farklı alanlarında geliştirilmiştir, sağlık, biyoloji, pazar analizi, telekomünikasyon, bunlardan sadece birkaçı.

Gelecekteki eylemlerin tahminini yapmak için davranış modellerini tanımlayan bilgisayarlı süreçlerdir.

VERİTABANLARININ TARİHÇESİ

Bireylerin yıllar içinde uzmanlaşması sayesinde, soruşturmalar veya mülkiyet başlıkları gibi ürettikleri bilgileri, ölüm, doğum ve evlilik belgeleri dahil olmak üzere nüfus hakkında temel bilgileri koruma ihtiyacı doğdu.

Zaman geçtikçe, insanlık söz konusu bilgilerin fiziksel olarak korunmasından memnun kalmamış, bu nedenle yavaş yavaş veri yönetimini kolaylaştıracak elektronik cihazlar ve büyük miktarda depolama alanı geliştirmişlerdir.

20. yüzyılda fotoelektrik, manyetik bantların görünümü, UNIVAC gibi ilk bilgisayarlar gibi çeşitli teknolojiler kaydedildi, ancak 1960'ların sonlarına kadar taban modelini tanımlayan bir makale yayınlandı. gibi veriler.

Günümüzde büyük miktarda bilgi üretebilen, toplayabilen ve işleyebilen büyük veritabanları yönetilmekte, bu özellikler giderek maksimize edilerek daha güçlü ve daha güçlü hale gelmektedir (Martínez, E., 2000)

ORGANİZASYONLARDA BÜYÜK VERİ

Kuruluşlar, "bulut" denilen gibi çeşitli faktörler veya depolama ortamları sayesinde bu terimi daha sık kullanır, Büyük veri, kolaylaştırmak için metin madenciliği, veri madenciliği ve duyarlılık madenciliği gibi araçları kullanır. karar verme, bir organizasyonu giderek daha verimli hale getirmek.

İleri teknoloji sayesinde, kuruluş için bu unsurların kullanımından kaynaklanan maliyetlerin yanı sıra depolama boyutu da artmıştır.

Kuruluşlar, daha verimli olmak ve daha yüksek getiri elde etmek için ana hedeflere sahiptir, bu nedenle verilerinin analizine, yapılandırılmış veya geleneksel teknikleri ve yukarıda belirtilen maden şirketleri gibi yapılandırılmamış veya yarı yapılandırılmış teknikleri eklerler. video, kitaplar ve diğerleri.

Analiz edilen verilerden mümkün olan en kısa sürede sonuç çıkarabildikleri, tüm bunların rekabet avantajı elde etmeleri için genel olarak bu anlamda ele alınan veriler şunlardır:

  • Geleneksel (işlemsel) bir şirketten alınan veriler. Müşteriler, tedarikçiler, malzemeler, vb. Hakkında genel bilgiler. Veri sensörleri tarafından oluşturulan veriler. Genellikle üretildikleri andan itibaren farklı ekipmanlara entegre edilmiş sensörlerdir, chipSocial verileri de dahil olmak üzere akıllı sayaçlar olarak da adlandırılırlar. İnternet tarafından sunulan tüm sosyal ağlar, en iyi bilinenleri twitter veya Facebook ve fotoğraf ve ses gibi unsurları içerir. Mobilite tarafından oluşturulan veriler. Genellikle bir Tablet, Akıllı Telefon veya Skype aracılığıyla olabilen bir mobil teknoloji ekibi tarafından sağlanır (Joyanes, L., 2013).

VERİ MADENCİLİĞİ

Bilişim teknolojilerinin sürekli yönetimi sayesinde doğmuştur -Bunu anlatmakla görevli farklı yazarlar vardır, bu nedenle belirlenen en önemli tanımlardan bahsedilecektir.

"Veri madenciliği başlangıçta büyük miktarda veriyi inceleyerek yeni ve önemli ilişkileri, modelleri ve eğilimleri keşfetme süreci olarak tanımlanabilir" (Pérez, C. & Santín, D., 2008)

Veri madenciliği, verilerde açıkça temsil edilmeyen ve verilerden daha faydalı olabilecek bilgileri elde etmek için yarı otomatik yapay zeka, istatistiksel analiz, veri tabanları ve grafik görselleştirme tekniklerinin bir kombinasyonu olarak kabul edilir. kalkış. (Martínez, E., 2000)

VERİ MADENCİLİĞİNİN HEDEFLERİ

Muazzam miktarda bilginin varlığı ve sözde bilgi teknolojilerinin büyük ilerlemesi nedeniyle, analizi ve kontrolü için özel teknikler üretilmiştir.

Bu teknikler, içerdiği bilgilerin kesin bir şekilde tanımlanmasını, yani sadece metinsel bir şekilde değil, aksi takdirde, algoritmalar, sinir ağları, veri analizi gibi farklı araçlar aracılığıyla bilgi kalıplarını ve eğilimlerini keşfederler. bazıları (Pérez, C. & Santín, D., 2008)

Veri ve bilgi yönetimi tarih boyunca farklı aşamalardan geçti ve sonunda veri madenciliğine ulaştı, bu nedenle bu konuda daha net bir fikir sağlamak için aşağıdaki temsili dikkate almak gerekir:

VERİ MADENCİLİĞİNİN ÇALIŞTIRILMASI

Bu teknik, bir davranış tahmini oluşturarak, verileri ve bilgileri yeterince "anlayan" kalıpları tanımlar ve çıkarır.

Veri madenciliğinin açık bir örneği, ETL (Çıkarma, Dönüştürme, Yükleme) olarak adlandırılan aşamalardır; verilerin okunması, birleştirilmesi, dönüştürülmesi, bakımı ve veri planlamasıdır (Pérez, C. & Santín, D., 2008) bu model aşağıdaki şekilde sunulmuştur:

METİN MADENCİLİĞİ

Bu teknik, genellikle özel yazılımlara eklenmiş olarak bulunan belirli bir miktardaki bilgiden belirli bir öğe hakkında yararlı bilgiler edinmeye veya bulmaya dayanır.

Bu teknik, mevcut bilgilerin çeşitliliği arasındaki modellerin, eğilimlerin ve ilişkilerin keşfine odaklanır. Metin madenciliği aşağıdaki alanları kapsar:

  • Metinlerin sınıflandırılması Metinlerin sınıflandırılması Kümelerin oluşturulması İlişkilerin keşfi Sapmaların tespiti Trend analizi Özetlerin oluşturulması (Montes, M., s / f)

Metin madenciliği süreci iki aşamaya ayrılmıştır:

  • İlki işleme denir. Metinlerin yapı şeklinde temsil edildiği ve başka bir keşif çağrısı yapıldığı yer. Örnekler veya eğilimler gibi keşfedilecek hedeflerin tanımlandığı yerler (Tan, 1999)

Genel olarak, metin madenciliği olarak kabul edilen sistemler, analiz ve yorumlamayı kolaylaştıran, dikkate alınan bazı anahtar kelimelerin basit temsillerine ve tanımlamalarına sahiptir, bu nedenle temsillerinin yerleşik eğilimlerle sınırlandırıldığı söylenebilir.

METİN MADENCİLİĞİ UYGULAMALARI

Metin madenciliği, en önde gelenleri:

  • Güvenlik yönleri. Farklı bilgi kaynaklarının izlenmesinin yanı sıra olası şifreli metinlerin daha ayrıntılı incelenmesi için kullanılır Biyomedikal yönler. Hesaplamalı dilbilim de dahil olmak üzere doğal dil işleme, hesaplama, biyoinformatiğin analiz edildiği, yakın zamanda geliştirilen bir araştırma yönüdür.Kuruluşların kaybını önlemek için kuruluşların müşterilerle olan ilişkilerini analiz etme gerçeği ortaya çıkar. Akademik uygulamalar. Pek çok durumda, çeşitli makaleler yayınlanırken, indeksleme istenir, bu, çok özel bir şekilde kurulmuş, belirli bir miktar ve kalitede tarafların varlığını ifade eder.

MADENCİLİĞİ HİSSETMEK

Zaten duyarlılık madenciliği olarak bilinen, metin madenciliğinin bir türevidir, bu durumda müşterilerin veya kullanıcıların farklı medyadaki, örneğin e-posta, Facebook gibi farklı arama motorları ile niyetlerini belirlemeye çalışılır. ağda bulunanlar.

Veri madenciliğinin temel süreci şu şekilde yapılır:

  • Metni, örneğin belirli bir işletme, restoranlar veya seyahat acenteleri gibi belirli bir öğeyle anlamak veya ilişkilendirmek için girişimde bulunulur, ardından müşterinin niyeti belirlenir ve bunu olumlu olarak oluşturan ifadelerin üzerine bir etiket veya negatif, örneğin, veritabanlarında "harika" kelimesi iyi olarak sınıflandırılmışsa, pozitif bir etiket eklenir, aksi takdirde "zayıf" kelimesi kötü olarak sınıflandırılırsa bir negatif etiket eklenir.

Bu etiketlerin analizi sayesinde kuruluş, tüketicilerinin düşünceleri ve sıkıntıları hakkında daha fazla bilgiye sahip olur. (Pérez, S., 2016)

MADENCİLİK KULLANIMINDA ETİK

Bazı veritabanlarında işlenen bilgiler, birçok durumda farklı kuruluşların bunları uygun gördükleri amaçlar için kullanacaklarının tam olarak farkında olmayan kullanıcılardan gelir.

Elektronik satın almalar, ödemeler, telefon görüşmeleri ve diğerleri, gün be gün üretilen ve uygun şekilde kaydedilen bilgilerdir, toplum ürettiği büyük miktardaki bilginin ve neden olabileceği tehlikelerin farkında değildir (Garriga, A., 2004)

Bu bilgiler sayesinde veri madenciliği, belirli faydalar elde etmek için toplumla kurulabilecek etki türünü gösterir.

Bununla birlikte, her şey bu madencilik faaliyetlerine aykırı değildir, bu teknoloji, çalışanlarını daha verimli hale getirmek, davranışlarını ve becerilerini analiz etmek için kuruluşları destekler.

Tarayıcıları veya e-postayı izleyerek bile, bir işbirlikçinin yeni iş fırsatları arayışı içinde olup olmadığını veya terörizm dahil olmak üzere şirketin faaliyetlerine zarar veren herhangi bir davranışta bulunup bulunmadığını araştırmak mümkündür (Franganillo, J., 2010)

KAYNAKÇA REFERANSLAR

  • Franganillo, J. (2010). Veri madenciliğinin etik sonuçları. ThinkEPI Yearbook.Garriga, A. (2004). Kişisel verilerin işlenmesi ve temel haklar Joyanes, L. (2013). Büyük Veri: Kuruluşlardaki büyük hacimli verilerin analizi (İlk). Meksika DF: Alfaomega.Martínez, E. (2000). Veri madenciliği, karar verme aracı. UNAM. Http://132.248.9.195/pd2001/287820/Index.html Montes, M. (s / f) adresinden kurtarıldı. Metin Madenciliği: Yeni Bir Hesaplamalı Zorluk. Meksika DF: IPN. Http://ccc.inaoep.mx/~mmontesg/publicaciones/2001/MineriaTexto-md01.pdf Pérez, C. ve Santín, D. (2008) adresinden erişildi. Veri madenciliği, teknikleri ve araçları (Ediciones Paraninfo SA). İspanya. Https://books.google.com.mx/books?id=wzD_8uPFCEC&printsec=frontcover& adresinden kurtarıldıdq = madenci% C3% ADa + de + datos & hl = es419 & sa = X & sqi = 2 & redir_esc = y # v = onepage & q = miner% C3% ADa% 20de% 20datos & f = falsePérez, S. (2016). Duygu analizi. Venezuela Merkez Üniversitesi, Tan. (1999). Son teknoloji ve zorluklar, Proc. Gelişmiş Veritabanlarından Atölye Bilgi Keşfi. metin madenciliği.
Orijinal dosyayı indirin

Veri, metin ve duygu madenciliği. organizasyonlarda büyük veri