Logo tr.artbmxmagazine.com

Eğitim denetim hizmetleri için küme analizi

İçindekiler:

Anonim

Bu makale, Denetim hizmetinin kalitesi ile ilgili bir Doktora Tezi Projesi kapsamında yürütülen araştırma ile bağlantılıdır. Bölgelerin seçimi, seçimi rastgele bir fenomen olmamalı, ancak bunu haklı çıkaran istatistiksel araçların kullanıldığı bir sürecin sonucunu gerçekleştirmek için gereklidir, onlar için Küme Analizi tekniği kullanılmıştır. Denetim hizmetine dayalı olarak tanımlanmış değişkenlere.

Kümeleme analizine giriş.

Küme Analizi, Sayısal Taksonomi veya Örüntü Tanıma olarak da bilinen küme analizi, amacı bir grup hedefleri gruplara ayırmak olan çok değişkenli bir istatistiksel tekniktir, böylece aynı gruptaki hedeflerin profilleri çok benzerdir birbirleri arasında (iç grup uyumu) ​​ve farklı küme hedefleri arasındaki fark farklıdır (dış grup izolasyonu).

Akademisyenler ve pazar araştırmacıları, bireyler, firmalar, ürünler ve hatta davranışlar gibi homojen nesne gruplarını tanımlayarak çalışmalarını çözmek için genellikle en iyi çözümü bulurlar.

Hedefleme veya hedef pazarlama gibi popülasyon içindeki grupların tanımlanmasına dayanan stratejik seçenekler, metodolojik bir amaç olmadan mümkün olmayacaktır. Aynı ihtiyaç, fiziksel bilimlerden (örneğin, böcekler veya memeliler gibi çeşitli hayvan gruplarının sınıflandırılması) sosyal bilimlere (örneğin, çeşitli psikiyatrik profillerin analizi) kadar diğer alanlarda da bulunur.

Tüm bu örneklerde analist, çok değişkenli bir profile dayanan gözlemlerle doğal bir yapı bulmaya çalışır. Bu amaçla en sık kullanılan teknik, Konglomerat Analizi'dir (şu an için Küme Analizi, AC).

Başından beri açık olmalı:

  • Tekniğin meslek / çıkarımsal özellikleri yoktur Bu nedenle, bir örnek için elde edilen sonuçlar sadece bu tasarıma hizmet eder (değeri sadece analistin hedefleriyle ilgilidir): bireylerin seçimi, kullanılan ilgili değişkenler, kullanılan kriter benzerliği, gruplama düzeyi seçilen son…. Farklı çözümler tanımlarlar: Kümenin ve ayrımcılığın çok fazla ortak noktası yoktur: ayrımcı bir yapıyı açıklamaya çalışır ve Küme onu belirlemeye çalışır.

İki Temel Amaç:

  • Keşifsel veya doğrulayıcı amaçlar için "taksonomik" analiz Veri boyutunun değiştirilmesi (basitleştirilmesi) (bu belgenin başında açıklanan: yeni (grup) çalışma yapılarındaki münferit nesnelerin gruplandırılması)

Küme Analizi Nedir?

AC, nesneleri veya vakaları konglomeratlar (kümeler) olarak adlandırılan nispeten homojen gruplara sınıflandırmak için kullanılan bir dizi teknikten başka bir şey değildir.

Her gruptaki nesneler (konglomeratlar) birbirine benzer (Küme içinde yüksek iç homojenlik) ve önceden belirlenmiş bazı seçim kriterlerine göre diğer grupların nesnelerinden (Kümeler arasında yüksek dış heterojenlik) farklı olma eğilimindedir.

Bu şekilde, sınıflandırma başarılı olursa, küme içindeki nesneler geometrik sunumda birbirine çok yakın olacak ve farklı kümeler birbirinden çok uzak olacaktır. Bu analiz aynı zamanda bir sınıflandırma analizi veya sayısal sınıflandırma olarak da bilinir.

AC, özdeş özelliklere sahip nesneleri bir arada gruplamak gibi temel bir amaca sahiptir; Bu analiz, bağımlı değişkenler (DV) ve bağımsız değişkenler (VI) arasında herhangi bir ayrım yapmaz, ancak tüm değişkenler grubunun birbirine bağlı ilişkilerini hesaplar.

AC, pazarlamada aşağıdakiler dahil çeşitli amaçlarla kullanılır:

  • Pazar bölümleme

    Örneğin, tüketiciler bir ürünü satın almaktan elde edilen faydalar temel alınarak gruplandırılabilir. Her grup, aradıkları faydalar bakımından nispeten homojen tüketicilerden oluşacaktır. Bu yaklaşım kar segmentasyonu olarak bilinir ve Alıcı Davranışını Anlamak

    AC, homojen alıcı gruplarını tanımlamak için kullanılabilir. Böylece, her grubun davranışı ayrı ayrı incelenebilir. Bu analiz aynı zamanda alıcıların harici bilgi elde etmek için kullandıkları stratejileri belirlemek için de kullanılır.

    Markaları ve ürünleri gruplandırarak pazardaki rekabetçi kümeler belirlenebilir. Aynı gruptaki markalar, diğer gruplardan daha fazla birbirleriyle rekabet eder. Bir şirket, yeni ürünler için potansiyel fırsatları belirlemek amacıyla mevcut tekliflerini rakiplerine kıyasla analiz edebilir.Test Pazar

    Seçimi Şehirleri homojen gruplara bölerek, çeşitli stratejileri test etmek için karşılaştırılabilir şehirler seçmek mümkündür. pazarlama verilerinin azaltılması

    AC, bireysel gözlemlerden daha kolay veri alt grupları geliştirmek için genel bir veri azaltma aracı olarak kullanılabilir. Müteakip çok değişkenli analiz, bireysel gözlemlerden ziyade alt gruplara göre yapılır. Örneğin, ürün kullanım davranışındaki farklılıkları tanımlamak için önce tüketiciler gruplandırılabilir. Kümeler arasındaki farklar, çoklu ayırma analizi kullanılarak incelenebilir.

AC, birçok farklı durumda verileri analiz etmek için yararlı bir araçtır. Örneğin, bir anket aracılığıyla veri toplayan bir araştırmacı, yönetilebilir gruplar içinde olmadıkça anlamsız olan çok sayıda gözlemle karşılaşabilir.

AC bu veri gruplamasını, tüm popülasyonun bilgilerini veya belirli küçük gruplar hakkındaki bilgi örneğini azaltarak objektif olarak gerçekleştirebilir. Örneğin, popülasyon içindeki en büyük grupları belirleyerek bir popülasyonun tutumlarını anlayabilirsek, çok sayıda grup içindeki tüm popülasyonun verilerini azaltabiliriz. Bu şekilde, araştırmacı, asgari bilgi kaybıyla, gözlemlerin daha fazla özlüğe ve daha anlaşılır bir açıklamasına ulaşır.

AC aynı zamanda bir araştırmacı verilerin niteliği ile ilgili hipotezler geliştirmek istediğinde de kullanılabilir. Örneğin, bir araştırmacı, normal şekerli içeceklerin tüketicileri karşısında düşük şekerli alkolsüz içeceklerin tüketilmesine ilişkin tutumların, tüketicileri mantıksal gruplara veya segmentlere ayırmak için kullanılabileceğine inanabilir. AC, alkolsüz içecek tüketicilerini normal veya düşük kalorili alkolsüz içeceklere karşı tutumlarına göre sınıflandırabilir ve ortaya çıkan kümeler benzerliklere ve demografik farklılıklara göre özetlenebilir.

Ancak, küme oluşturma sorununa tek ve kesin bir çözüm asla beklenmemelidir.

Uygulamada, bu analiz tarafından sunulan birçok tekniğin uygulanmasından elde edilen çeşitli çözümler dikkate alınacak ve bunların karşılaştırılmasından sonra, önerilen araştırma türü için en yararlı olana doğru eğileceğiz. Araştırmacının müşterileri, ürünleri veya hizmetleri hakkındaki bilgisi, farklı alternatif çözümler arasında karar verirken önemli bir rol oynayacaktır.

Küme Analizinin Temel Kavramları

Bu çok değişkenli teknikte kullanılan prosedürlerin çoğu, istatistiksel akıl yürütme tarafından desteklenmediği için nispeten basittir. Gruplama yöntemlerinin çoğu sezgisel, algoritmaya dayalıdır. Bu nedenle AC, istatistiksel akıl yürütmeye dayanan varyans analizi, regresyon, ayırıcı analiz ve faktör analizi ile güçlü bir tezat oluşturur.

Herhangi bir CA'da yer alan temel ilkeler şunlardır:

  • Toplama Raporu

    Hiyerarşik bir gruplama sürecinin her aşamasında birleştirilen nesneler veya vakalar hakkında bilgi sağlar Gruplama Merkezleri

    Belirli bir gruptaki tüm vakalar veya nesneler için değişkenlerin ortalama (ortalama) değerleri.

    Hiyerarşik olmayan gruplamanın ilk başlangıç ​​noktalarıdır. Gruplar bu merkezler veya tohumlar etrafında oluşturulur Grup

    Katılımı Her bir nesnenin veya vakanın ait olduğu grubu gösterir Dendrogram

    Ağaç grafiği olarak da adlandırılan kümenin sonuçlarını sunmak için grafiksel bir cihazdır.

    Dikey çizgiler birleştirilen grupları temsil eder. Çizginin ölçek üzerindeki konumu, grupların katıldığı mesafeleri gösterir. Soldan sağa okunur Grup Merkezleri arasındaki mesafeler Grupların

    bireysel çiftleri arasındaki ayrımı gösterir. Geniş olarak ayrılmış gruplar ayrıdır ve bu nedenle arzu edilir Buz sarkıtları Diyagramı

    Kümenin sonuçlarının grafik bir temsilidir, öyle adlandırılır, çünkü bir evin saçaklarından sarkan bir dizi buz sarkıtına benzemektedir. Sütunlar, gruplanan nesnelere ve satırlar küme sayısına karşılık gelir. Aşağıdan yukarıya okuma Mesafe / Benzerlik Katsayıları Matrisi

    Nesneler veya durumlar arasındaki eşleştirilmiş yönde mesafeleri içeren alt üçgen bir matristir.

Küme Analizi Adımları

İlk adım, gruplama problemini dayandığı değişkenleri tanımlayarak formüle etmektir. Ardından uygun bir mesafe ölçümü seçilmelidir. Uzaklık ölçüsü, birlikte gruplanan nesnelerin ne kadar benzer veya farklı olduğunu belirler. Ardından bir gruplama prosedürü seçilmelidir. Bazıları mevcuttur, ancak önerilen araştırma problemine en uygun olanı seçmek araştırmacının görevidir.

Küme sayısının kararı araştırmacının kriterlerini gerektirir. Elde edilen kümeler, ek belirgin değişkenler açısından yorumlanmalıdır. Son olarak, araştırmacının kümelenme sürecinin geçerliliğini değerlendirmesi gerekmektedir.

1. Sorunun Formülasyonu

KG problemini formüle etmenin belki de en önemli kısmı, gruplamanın dayandığı değişkenlerin seçilmesidir. Bir veya daha fazla alakasız değişkenin dahil edilmesi, başka türlü faydalı olabilecek bir gruplama çözümünü bozabilir. Temel olarak, seçilen değişkenler grubu, pazar araştırması problemi için ilgili terimlerle nesneler arasındaki benzerliği tanımlamalıdır. Değişkenler önceki araştırmalara, teoriye veya test edilen hipotezlerin dikkate alınmasına göre seçilmelidir. Keşifsel araştırmalarda, araştırmacı yargı ve sezgi uygulamak zorundadır.

2. Benzerlik Önleminin Seçimi

Kümenin nesnesi benzer nesneleri bir arada gruplandırmak olduğundan, nesneler arasındaki farklılıkları ve benzerlikleri değerlendirmek için bazı önlemler alınması gerekir. Küme Analizinde benzerlik kavramı esastır. Benzerlik (benzerlik), gruplanacak nesneler arasındaki yazışma veya benzerliğin bir ölçüsüdür. En yaygın strateji, eşdeğerlerin nesne çiftleri arasındaki mesafe cinsinden ölçülmesidir. Aralarında mesafeleri azaltılmış nesneler, mesafeleri büyük olanlardan daha benzerdir ve bu nedenle aynı kümede gruplandırılacaktır.

Bu şekilde, herhangi bir nesne benzerlik ölçüsü ile diğer herhangi bir nesne ile karşılaştırılabilir.

Bir CA'nın nesneleri arasındaki benzerliğin ölçülmesinde üç yöntem vardır:

  • Korelasyon Önlemleri Mesafe Önlemleri Birlik Önlemleri

Bu yöntemlerin her biri, hem hedeflere hem de veri türüne bağlı olarak benzerlik üzerine belirli bir perspektifi temsil eder. Korelasyon ve mesafe ölçümleri metrik veriler gerektirirken, ilişkilendirme önlemleri metrik olmayan veriler gerektirir.

Birçok bilgisayar programının ilişkilendirme önlemleri için sınırlı desteği vardır ve araştırmacı genellikle benzerlik önlemlerini hesaplamak ve daha sonra benzerlik matrisini bir küme programına sokmak zorunda kalır.

3. Veri Standardizasyonu

Ölçüm, nesne çiftleri arasındaki benzerliği ölçmek için seçildikten sonra, araştırmacı son bir soru sormalıdır… benzerlikler hesaplanmadan önce veriler standartlaştırılmalı mıdır? Bu soruyu yeterince cevaplamak için araştırmacı, mesafe ölçümlerinin çoğunun değişkenler arasında yapılan ölçek veya büyüklük farklılıklarına oldukça duyarlı olduğunu dikkate almalıdır.

Genel olarak, büyük bir dispersiyona sahip değişkenlerin (standart sapmalarının büyük değerleri) benzerliğin nihai değeri üzerinde daha fazla etkisi vardır.

Bir dizi insanın bireyselliklerini üç değişkene ayırmak istediğinizi bir örnek olarak düşünelim: bir ürüne karşı tutum, yaş ve gelir. Yaşları yıllar ve kazançlar dolar olarak ölçülürken, tutumu yedi puanlık beğenmeme ölçeğinde ölçmemiz gerekiyor.

İlgili araştırmanın sonuçlarını üç boyutlu bir grafik üzerinde çizersek, noktalar arasındaki mesafe (ve benzerlikleri) neredeyse tamamen gelir farklılıklarına dayanacaktır.

Açıklama oldukça basit, ürüne karşı tutumdaki olası farklılıklar bir ila yedi arasında değişen bir dizi tutumda bulunurken, gelirde üretilenler yüz kat daha fazla olabilir.

Bu şekilde, ürüne karşı tutum ile ilişkili boyutta herhangi bir fark gözlemleyemeyiz (grafiksel olarak). Bu nedenle araştırmacı, araştırmaya katılan değişkenlerin örtük ağırlığının farkında olmalıdır.

En yaygın standardizasyon şekli, her değişkenin tipik puanlara (Z puanları olarak da bilinir) dönüştürülmesidir. Hesaplamanın yolu, her değişkenin her gözleminin karşılık gelen ortalamadan çıkarılması ve bu işlemin sonucunun, söz konusu değişkenin standart sapmasına (standart) bölünmesidir.

Bu işlem, her orijinal verinin puanını, ortalama sıfır ve standart sapma ile standartlaştırılmış bir değere dönüştürür. Kısacası, bununla elde edilen, analizde kullanılan farklı özelliklerin (değişkenlerin) ölçeklerindeki farklılıkların getirdiği önyargıları tek tek ortadan kaldırmaktır.

4. Analizin Varsayımları

AC bir dizi gözlemin özelliklerini ölçmek için metodolojik bir amaçtır. Bu nedenle, güçlü matematiksel özelliklere sahiptir, ancak istatistiksel temelleri yoktur. Normallik, doğrusallık ve homoscedasticity (diğer tekniklerle çok alakalı) gereklilikleri AC'de çok az tutarlılığa sahiptir.

Bununla birlikte, araştırmacı dikkatini bu tür bir analiz için iki temel soruya odaklamalıdır, örneğin: numunenin temsil edilebilirliği ve çoklu doğrusallık.

Birçok durumda, küme analizini kullanmak için bir nüfus sayımı mevcuttur. Daha sonra bir vaka örneği alınır ve ondan elde edilen kümelerin orijinal popülasyonun yapısını temsil etmesi beklenir. Analist, kümelenme analizinin örneğin temsiliyeti kadar iyi olacağını daima akılda tutmalıdır.

Bu nedenle, tüm çabalar bu temsiliyetin sağlanmasına odaklanmalıdır, böylece sonuçlar ilgili popülasyona genelleştirilebilir.

Çoklu doğrusallık diğer çoklu değişkenli tekniklerin bir sonucudur, çünkü çoklu doğrusal değişkenlerin gerçek etkisini ayırt etmek zordur. Öte yandan, kümelenme analizinde etki farklıdır, çünkü çok doğrusal doğrusal değişkenler dolaylı olarak daha şiddetli bir şekilde ağırlıklandırılmıştır.

Örneğin, katılımcıların belirli bir hizmetle ilgili on değişken olarak gruplandığını varsayın. Çoklu doğrusallığı incelerken, gerçekten açıkça farklılaştırılmış iki değişken grubu olduğunu takdir ediyoruz.

Birincisi sekiz elemandan (değişkenler) ve ikincisi geri kalan ikiden oluşur.

İstediğimiz katılımcıları analiz edilen hizmetin boyutlarında gerçekten gruplandırmaksa (bu durumda iki değişken grubu tarafından temsil edilir), on değişkeni bir bütün olarak düşünemeyiz, çünkü bu her değişkeni eşit olarak ağırlıklandırmak anlamına gelir.

Diğer bir deyişle, kümelenme analizi her değişken için eşit olarak ağırlıklandırıldığında, ilk boyut, benzerlik ölçüsünü ikinci boyuttan etkilemek için dört kat daha fazla fırsata (ikiye karşı sekiz madde) sahip olacaktır.

Bu nedenle, çoklu-doğrusallık eylemi, gözlemciden gizlenen ancak yine de analizi etkileyen bir ağırlıklandırma işlemidir. Bu nedenle analist, olası çoklu doğrusallığı bulmak için küme analizinde kullanılan değişkenlerin kapsamlı bir çalışmasını teşvik etmelidir.

Çalışma için kullanılan değişkenlerde çoklu eşleniklik bulunursa, keşfedilen mevcut korelasyonu telafi etmek için her sette aynı sayıda elde edilmesi veya Mahalanobis Mesafesi gibi mesafe ölçülerinden birini kullanması gerekecektir.

Değişkenler seçildikten ve benzerlik matrisi hesaplandıktan sonra, bölümleme işlemi başlar. İlk olarak, araştırmacı kümeleri (grupları) oluşturmak için kullanılacak gruplama algoritmasını seçmeli ve daha sonra oluşturulacak grup sayısı konusunda karar vermelidir.

Her iki kararın da sadece elde edilen sonuçlarda değil, aynı zamanda onlardan türetilebilecek yorumlarda da önemli etkileri vardır.

5. Gruplama Prosedürünün Seçilmesi

İki tür prosedür vardır: hiyerarşik ve hiyerarşik olmayan. Hiyerarşik holding, bir hiyerarşi veya ağaç benzeri bir yapının gelişimi ile karakterizedir.

Hiyerarşik prosedürlerin önemli bir özelliği, ilk aşamanın sonuçlarının son aşamanın sonuçlarıyla iç içe olabilmesiyle ağaç benzeri bir benzerliğe yol açabilmesidir. Örneğin, altıncı kümenin çözümü, kümenin yedinci evresinde bulunan iki kümenin birleşmesi sayesinde elde edilir.

Bu şekilde, kümeler yalnızca mevcut grupların birliği tarafından oluşturulur, böylece bir kümenin herhangi bir üyesi ilişkilerini basit bir ilişki ile başlayacak kırılmaz bir yolda izleyebilir.

Hiyerarşik yöntemler Toplama veya Bölme yoluyla olabilir. Aglomerasyon kümelenmesi, her bir nesne ile ayrı bir grupta başlar.

Kümeler, nesneleri giderek daha büyük kümeler halinde gruplayarak oluşturulur. Bu işlem, tüm nesneler tek bir grubun parçası olana kadar devam eder.

Bölüm kümeleme, tüm nesnelerin tek bir kümede gruplanmasıyla başlar. Kümeler, her nesne bağımsız bir grup olana kadar bölünür.

Kümeleme ile kümelenmeler içinde, pazar araştırmasında sıklıkla kullanılan kümeleme yöntemleri yer alır.

Bağlantı yöntemleri, Varyans yöntemleri veya hata karelerinin toplamları ve Centroid yönteminden oluşur. Bağlantı Yöntemleri arasında tek link, tam link ve ortalama link bulunur.

Basit bağlantı yöntemi, minimum mesafe veya en yakın komşu kuralını temel alır. İlk iki holding nesnesi birbirinden en kısa mesafeye sahip olan nesnelerdir. Üçüncü nesnenin ilk iki ile gruplanıp gruplanmadığı veya iki nesneden oluşan yeni bir kümenin oluşup oluşmadığı bir sonraki en kısa mesafe belirlenir.

Her aşamada, iki küme arasındaki mesafe en yakın iki noktası arasındaki mesafedir.

Herhangi bir aşamada, iki küme aralarındaki en kısa tek bağlantıdan ortaya çıkar. Bu işlem, tüm nesneler kümede olana kadar devam eder.

Kümeler iyi tanımlanmadığında basit bağlantı yöntemi düzgün çalışmaz.

Tam bağlantı yöntemi, maksimum mesafeye veya en uzak komşu stratejisine dayanması dışında tek bağlantıya benzer. Bu durumda, iki küme arasındaki mesafe en uzak noktaları arasındaki mesafe olarak hesaplanır.

Ortalama bağlantı yöntemi benzer şekilde çalışır, ancak bu yöntemde, iki küme arasındaki mesafe, kümelerin her birinin çiftinin bir üyesinin bulunduğu tüm nesne çiftleri arasındaki mesafelerin ortalaması olarak tanımlanır (Bkz. Küme için Şekil Bağlantı Yöntemleri). Görülebileceği gibi, ortalama bağlantı yöntemi, yalnızca minimum veya maksimum değil, tüm uzaklık çiftleriyle ilgili bilgileri kullanır. Bu nedenle, genellikle basit ve tam bağlama yöntemlerine göre tercih edilir.

Varyans Yöntemleri, gruplar içindeki varyansı azaltmak için kümeler oluşturmaya çalışır. Sık kullanılan bir varyans yöntemi, Ward Prosedürüdür.

Her küme için, tüm değişkenlerin ortalamaları hesaplanır. Daha sonra, her bir nesne için, grup araçları için kare Öklid mesafesi hesaplanır (Şekil Diğer Topaklaşma Kümeleme yöntemleri); bu mesafeler tüm nesnelere eklenir. Her aşamada, iki küme, kümeler içindeki mesafelerin karelerinin toplamındaki en küçük artışla birleştirilir.

Centroid Metodunda, iki grup arasındaki mesafe, Şekil Diğer Aglomerasyon Kümeleme metotlarında gösterildiği gibi, kendi centroidleri arasındaki mesafedir (tüm değişkenler için araçlar).

Nesneler her gruplandığında, yeni bir sentroid hesaplanır. Hiyerarşik yöntemlerden, Ortalama Bağlantı yöntemi ve Koğuş Prosedürü diğerlerinden daha iyi performans göstermiştir.

İkinci tip küme prosedürü, hiyerarşik olmayan küme yöntemleri, genellikle K-Ortalama Kümeleme olarak adlandırılır.

Bu yöntemler arasında Sıralı Eşik, Paralel Eşik ve Optimizasyon Bölümü bulunur.

Sıralı Eşik yönteminde, bir grup merkezi seçilir ve tüm nesneler, merkezden önceden belirtilen bir eşik değeri içinde gruplanır.

Daha sonra yeni bir grup merkezi veya tohum seçilir ve gruplanmamış noktalar için işlem tekrarlanır. Bir nesne bir tohumla gruplandığında, artık sonraki tohumlarla kümelenmesi için dikkate alınmaz. Paralel Eşik yöntemi, aynı anda birden çok grup merkezinin seçilmesi ve eşik düzeyindeki nesnelerin en yakın merkezde gruplanması dışında benzer şekilde çalışır.

Optimizasyon Bölümü yöntemi, diğer iki eşik prosedüründen farklıdır, çünkü belirli bir küme için gruplar arasındaki ortalama mesafe gibi genel bir kriteri optimize etmek için nesnelerin daha sonra diğer gruplara yeniden atanabilmesi.

Söz konusu nesnelerin nasıl gruplandığını bulmanın iki temel yolu vardır:

  1. Buz sarkıtları Grafiği

    Sütunları, gruplanan nesnelere (görüşmeciler,…) ve satırların grup sayısına karşılık gelir. Bu rakam aşağıdan yukarıya doğru okunur. Başlangıçta tüm vakalar bireysel gruplar olarak kabul edilir. İlk durumda, en yakın iki nesne birleştirilir.

    Sonraki her adım, aşağıdaki üç yoldan biriyle yeni bir grubun oluşmasına yol açar: (1) iki ayrı vaka gruplanır, (2) bir vaka mevcut bir gruba katılır, (3) iki grup birleşir.

    Soldan sağa okunur. Dikey çizgiler birleştirilmiş grupları temsil eder. Çizginin ölçek üzerindeki konumu, grupların katıldığı mesafeleri gösterir.

    Birçok aşama, erken aşamalarda büyüklük bakımından benzer olduğundan, en eski kümelerin bazılarının oluştuğu sırayı belirlemek zordur. Bununla birlikte, son iki aşamada, holdinglerin birleştirildiği mesafelerin büyük olduğu açıktır. Bu bilgi, küme sayısının belirlenmesinde faydalıdır.

Grup sayısını belirterek vaka kümelerinin katılımı hakkında bilgi edinmek de mümkündür. Her ne kadar bu bilgi saikül izinden çıkarılabilse de, tablo şeklinde bir gösterim yararlıdır.

Hiyerarşik ve Hiyerarşik Olmayan Yöntemler

6. Küme Sayısının Kararı

Tüm aglomerasyon tekniklerinde büyük bir problem, grupların (kümelerin) nasıl seçileceğidir. Ne yazık ki, nesnel seçim süreci yok.

Hiyerarşik küme analizi durumunda, kümelenme sürecinin farklı aşamalarında yansıtılan kümeler arasındaki mesafeler yararlı bir rehber görevi görebilir, böylece analist süreci uygun bir şekilde durdurmak için bir başlık oluşturabilir (bu bilgi programdan elde edilebilir) aglomerasyon veya dendrogram).

Örneğin, gruplar arasındaki mesafe belirli bir değeri aştığında veya adımlar arasındaki birbirini takip eden mesafeler ani bir sıçramaya işaret ettiğinde bunu yapabilirsiniz.

Bununla birlikte, en çok kullanılan seçenek farklı aglomerasyon çözeltilerini (örneğin iki, üç, dört grup) hesaplamak ve daha sonra önceden belirlenmiş bir kriter, sağduyu veya teorik temeller yardımıyla alternatif çözümler arasında karar vermektir.

Bu mesafelere genellikle hata değişkenliği önlemleri denir.

Hiyerarşik olmayan küme analizi durumunda, grup sayısını grupların toplam varyansı ile gruplar arasındaki varyans arasındaki ilişkiyle karşılaştıran bir grafik çizilebilir.

Grafikte işaretli bir bükülmenin veya bükülmenin oluştuğu nokta, uygun grup sayısını gösterir. Genel olarak, bu noktanın ötesinde grup sayısını artırmaya değmez. Optimal grup sayısına karar vermenin bir başka olasılığı, verilerin teorik ilişkisinin bir tür sezgisel kavramsallaştırmasını tanımlamaktır.

Araştırmacılar, elde edilen sonuçları çalışma hedeflerinde yaratılan beklentilerle karşılaştırarak, grup boyutları arasında üretilen değişimi kavramsal bir perspektiften incelemelidir.

Bu tür analizlerde ortaya çıkabilecek bir diğer sorun, tek kişilik grupların, yani tek bir kişiden oluşan kümelerin varlığıdır. Bir sorun çünkü veri kaynağımızdaki hata ayıklama sürecinde tespit edilemeyen aykırı değerler (aykırı değerler) olabilirler.

Tek üyeli bir grup ortaya çıkarsa, analist, numunedeki geçerli bir yapısal bileşeni temsil edip etmediğini incelemeli veya aksine temsilci olmadığı için silinmelidir. Analizden herhangi bir gözlem çıkarılırsa, araştırmacı yeni geçerli gözlemler için küme analizini yeniden çalıştırmalı ve böylece yeni gruplar tanımlayabilmelidir.

7. Küme Profilinin Yorumlanması ve Hazırlanması

Grupların yorumu ve profili, grup sentroidlerinin analizini içerir. Centroidler, grubun değişkenlerin her birinde içerdiği nesnelerin ortalama değerlerini temsil eder. Centroids, bir isim veya etiket atayarak her grubu tanımlamamızı sağlar.

Küme programı bu bilgileri sağlamıyorsa, ayrımcı analiz yoluyla elde edilebilir.

Bu aşamanın amacı, esasen, doğalarını doğru bir şekilde tanımlayan etiketler atamak için kümelerin varyasyonunu incelemektir.

Grupların profilini, demografik, psikografik, ürün kullanımı, medya kullanımı veya diğer değişkenler gibi küme için kullanılan değişkenler açısından hazırlamak yararlıdır.

Sürecin nasıl çalıştığını daha iyi anlamak için bir örnek düşünelim. Varsayalım, düzenli olarak hafif içecek alımına karşı etkili diyeti incelemekle ilgileniyoruz.

Bunun için, yedi farklı ifadeden oluşan katılımcının tutumunun bir ölçeği oluşturulmuştur. Böylece görüşülen bireyler 1 ila 7 puan vermiştir. Yedi puanlık ölçeğin bir parçası olan ifadeler türdeydi: hafif diyet içecekleri daha güçlü tadı, diyet içecekleri daha sağlıklı, vb.

Çalışmaya uygunluklarından ötürü alkolsüz içecekler için demografik veriler ve tüketim verileri toplanması kararlaştırıldı.

Daha önce belirtildiği gibi, bu aşamada profil skor ortalamaları incelenir. Özel durumumuz için, her grup için tasarlanan tutum ölçeğine dayanarak her birine tanımlayıcı bir etiket atayabilmek.

Küme analizinden elde edilen gruplardan ikisinin hafif diyet içeceklerine karşı olumlu tutumlara ve üçüncü gruba olumsuz tutumlara sahip olduğunu varsayalım. Biri tutum açısından olumlu olan iki gruptan birinin sadece hafif diyet içeceklerine, diğeri ise hem hafif hem de normal alkolsüz içeceklere elverişli olması olasılığını yönetebilir.

Daha sonra her bir kümenin tutumlarını değerlendirir ve her grup için etiketlemeyi kolaylaştırmak için somut yorumlar geliştiririz. Örneğin, kümelerden biri sağlık ve kalori konusunda bilinçli bireyler, diğeri ise şeker artışına kayıtsız bireyler olarak etiketlenebilir.

Konglomeraların veya grupların profili ile ilgili olarak, her bir kümenin, ilgili boyutlarda nasıl çıkarımda bulunabileceklerini açıklamanın sadece bir açıklaması olduğu söylenmelidir.

Bunu başarmak için, normal olarak Diskriminant Analizi veya başka bir uygun istatistik kullanılır. Analist, her kümenin özelliklerini özetlemek için daha önce toplama prosedürüne dahil edilmemiş verileri kullanır.

Bu veriler genellikle demografik özellikler, psikografik profiller, tüketim kalıpları vb.

Bu süreci uygulayarak ve içecek örneğine yansıtarak, sağlık ve kalori bilinçli bireyler kümesinin, alkolsüz içeceklerin ılımlı tüketicileri oldukları için daha iyi eğitimde veya daha yüksek mesleki gelirde yattığı sonucuna varacağız.

Özetle, profil analizi, kümelerin neyi doğrudan belirlediğini değil (farklı gruplar belirlendikten sonra) kendi özelliklerini tanımlamaya odaklanmaktadır.

Bu nedenle grupları tanımlayan özelliklere ve her holding grubunun üyelerinin söz konusu kümenin belirli bir tutumunu tahmin etme kapasitesine özel önem verilmektedir.

8. Elde Edilen Kümelerin Doğrulanması

AC'nin kapsadığı genel kriterler göz önüne alındığında, güvenilirliği ve geçerliliği değerlendirilmeden hiçbir havuz çözümü kabul edilmemelidir. Validasyon, analistin elde edilen kümelerin orijinal popülasyonu temsil etmesini ve diğer nesnelere genelleştirilebilmesini ve zaman içinde kararlı olmasını sağlama girişimidir.

Aşağıdaki prosedürler, gruplama sonuçlarının kalitesi hakkında yeterli inceleme sağlar:

  • AC'yi aynı verilerle gerçekleştirin ve farklı mesafe ölçümleri kullanın. Çözümlerin kararlılığını belirlemek için sonuçları tüm ölçümlerle karşılaştırın Çeşitli kümeleme yöntemlerini kullanın ve sonuçları karşılaştırın Verileri rastgele yarıya bölün. AC'yi her yarıda ayrı olarak gerçekleştirin (alt örnek). İki analizin çözümlerini karşılaştırın ve sonuçların uygunluğunu değerlendirin veya iki alt örneğin grup sentroidlerini karşılaştırın Değişkenleri rastgele silin. Azalan değişkenler kümesine göre gruplandırma yapın. Kümeyi gerçekleştirirken elde edilen sonuçları kümenin tamamı ile karşılaştırın Hiyerarşik olmayan kümede çözüm, veri kümesindeki vakaların sırasına bağlı olabilir. Bunu incelemek için,çözüm stabilize oluncaya kadar birden fazla işlem yapılması ve vakaların farklı siparişlerinin kullanılması önerilir.

Değişkenlerin Tanımı

Değişkenler, değişebilen ve varyasyonları ölçülebilen özellik olarak tanımlanır. Örnekler: cinsiyet, iş motivasyonu, kişilik, kampanyaya maruz kalma, hizmet kalitesi.

Varsayımsal formülasyonlarla çalışırken, değişkenler arasında kurulan ilişkilerin türünün tanımı hayati öneme sahiptir, çünkü doğrulama bu ilişkilerin ne ölçüde gösterilebileceğine bağlıdır. Bu, değişkenlere bağlanan mantıksal terimlerin kullanımında büyük bir hassasiyet gerektirir, çünkü yanlış kullanılan bir ifade, formülasyonun anlamını tamamen bozabilir.

Değişkenler arasındaki ilişkiler şu şekilde sınıflandırılabilir:

  1. Tersinir: X, sonra Y ve Y sonra X veya geri döndürülemez: X, sonra Y, ancak evet Y ise, X ile ilgili bir sonuç yoktur. Deterministik: X ise, o zaman her zaman Y veya stokastik: X ise, o zaman muhtemelen Y. Sıralı: X ise, sonra Y veya birlikte var: X ise, o zaman Y. Yeter: X ise, o zaman başka bir şeyden bağımsız olarak, Y veya koşullu: X ise, sonra Y, ancak sadece Z ise. Gerekli: X ve yalnızca X ise, o zaman Y veya ikame edilebilir: X, o zaman Y, ancak Z, ayrıca Y. de bağımlıysa: tersinirlik, beklenmedik durum ve sıralılık öznitelikleri birleştirildiğinde, örneğin: eğer X, Xi, Xii, Xiii… 'ye göre değişir, sonra Y de Yi, Yii, Yiii…, vb.

Değişkenler arasındaki ilişkiler kesin bir şekilde kurulduktan sonra, operasyonlarını gerçekleştirmek, yani ölçülecek değişkenin varlığının doğrulanabileceği boyutları, göstergeleri, ölçekleri ve kategorileri tanımlamak gerekir.

Araştırma teorisinde, varsayımsal tasarımlarda yaygın olarak görülen üç değişken türü tanımlanmıştır: bağımlı, bağımsız ve yabancı değişkenler. İlk ikisi arasındaki ilişkinin karıştırıldığı veya ana ilişkiye paralel olanların dikkate alınmadığı birçok örnek olmasına rağmen, her birinin özellikleri hakkında daha ayrıntılı olarak ele almanın gerekli olduğunu düşünmüyoruz.

Nicel ve nitel boyutlar herhangi bir değişkende ayırt edilebilir. Değişken boyutlar uzamsal ve zamansal da olabilir. Diğer boyut türleri bağlamsal ve durumsaldır, ayrıca değişkenin boyutları bireysel ve grup olabilir.

Bu konu, çalışma nesnesinin önceden derinlemesine analiz edilmesini gerektirir, böylece seçilen değişkeni tanımlayan tüm boyutlar ve göstergeler hassas bir şekilde oluşturulabilir. Buradan sağlam ve doğrulanabilir bir hipotez geliştirilebilir.

Aşağıdaki şemada, Performans ve Okul Disiplininin seçildiği bir grup öğrenci örneğinde seçilen iki değişken için olası boyutların analizi sunulmaktadır:

boyutlar verim Disiplin
Nicel Geçme yüzdesi Gerçek miktarı
Nitel Derecelendirme kalitesi Aşkınlık, büyüklük
Amaç Puanlar Yaptırımlar ve teşvikler
Öznel Performans kriterleri (öğretmenler, öğrenciler, veliler, yetkililer ve diğerleri). Disiplin kriterleri (öğretmenlerden, öğrencilerden, velilerden, yetkililerden ve diğerlerinden).
Uzay Sınavlarda, sınıf çalışmasında, ekstra sınıf ödevlerinde ve diğerlerinde. Sınıf, atölye, spor alanı, kütüphane ve diğerleri.
Geçici Haftalık, aylık, dönem, öğretim yılı, kariyer vb. Haftalık, aylık, dönem, öğretim yılı, kariyer vb.
Bağlamsal Programlı veya sürpriz egzersizlerde. Öğretmenin ya da diğer insanların kontrolü altında.
Durumsal Kısmi, nihai veya seçicilik kontrollerinde. Öğretimde, ekstra öğretimde, eğlence faaliyetlerinde vb.
bireysel Konu, dönem ve derse göre bireysel performans. Disiplin kurallarına bireysel uyum.
grup Konu, dönem ve rotaya göre grup performansı. Disiplin kurallarına bireysel uyum.

Çalışılan bu öğelerden, çeşitli bibliyografyalara danışılan değişkenlerin seçimine veya tanımına geçiyoruz.

Yürütülmekte olan araştırma ve sürdürmekte olduğumuz son unsurlara dayanarak, Kalite Yöneticileri Dergisi Cilt 10 için Guimaraes, Sandy ve McKeen (2003) tarafından yapılan bir çalışma seçilmiştir. Issue4. Ekim 2003, "Kalite sistemlerinin geliştirilmesi ile ilgili bazı faktörlerin ampirik olarak doğrulanması" başlıklı, 228'den fazla kalite sisteminden gelen verilerle seçtikleri hizmetin kalitesini etkileyen değişkenleri seçmek için derinlemesine bir çalışma yapılmıştır. Burada ele alınan ve bu araştırmanın değişkenlerini belirlemek için temel dayanak olarak ele alınan hususlar dikkate alındığında, aşağıdakiler Küme Analizini gerçekleştirecek değişkenler olarak tanımlanmıştır:

  • Gerçekleştirilen denetim sayısı: Bu değişken, büyüklükleri ve bölgesel özellikleri dikkate alınarak her bölge tarafından gerçekleştirilen denetim sayısını gösterir. Sistemin sahip olduğu denetçi sayısı: Sistemin farklı bölgelerde sahip olduğu İnsan Kaynaklarını bilmemize izin verir, aynı zamanda hizmet sunumunda yer alan İnsan Kaynakları ihtiyaçlarının eksikliğini veya memnuniyetini de gösterir. Denetçi Yeterliliği: Hizmet sağlayıcıdan edinilen deneyimdir, tüm sağlayıcılar aynı eğitime sahip değildir. Sağlayıcının deneyimi, gerçekleştirilecek görevlerin hazırlanması ve yürütülmesi ile ilgili eğitim yoluyla elde edilir.İş sisteminin özellikleri: Bölgelerin iş sistemi, her bölgenin özelliklerine ve gelişimine bağlı olarak homojen veya heterojen olabilir; bu, sağlanan Denetim hizmetinin gerçekleştirilecek denetim sayısı, sayı bakımından farklı olduğunu gösterir. ilgili denetçilerin, taahhüt edilen kaynakların, Denetimin yürütme süresinin, İnsan Kaynaklarının yeniden yeterliliğinin ve eğitiminin

Kaynakça:

Aiteco Danışmanları, Yöntemleri ve Araçları.

Barredo Prieto, Manuel ile ilgili tarafsız yorumlar, yazılar, öneriler ve görüşler sağlar. Kalite Felsefeleri.

Benitez Miranda, Miguel Angel, Miranda Dearubas, María Victoria. Yönetim ekiplerinin ekonomik eğitimi için Muhasebe ve Finans / Angel Miguel Benitez Miranda, Maria Victoria Mirandas Dearubas. - Hafif Sanayi Bakanlığı, 1997.

Blázquez Moral, Juan. Denetim. Juan Blázquez Moral. Nacional de Cuba, Havana, 1965

Bolten, Steven E. Mali Yönetim. E. Steven Bolten. Editoryal Limusa SA Balderas. Houston Üniversitesi. Meksika. DF, 1995.

Cantú. Kalite kültürünün geliştirilmesi. Cantú, HD, Mc Graw_Hill. 2001.

Yazarlar topluluğu. CECOFIS. Genel Denetim Diploması. Kendi kendine çalışma kılavuzu. 2001 Cilt 1 ve 2

_______, Denetim İlkeleri. Havana şehri. Küba.

_______, Denetim Standartlarına İlişkin Düzenlemeler. Ulusal Denetim Ofisi. Küba, 1999.

Colín, Leticia. "Kalite Yönetim Sistemleri için ISO 9000-2000 standartları"

Cook, John W. ve Winkle, Gary M. Audit, 3. Baskı, McGRAW-HILL, Buenos Aires-Arjantin, 1987.

Cospin, M Oswaldo. 7 Kalite kontrol için temel araçlar.

De Miranda, Antonio; Torras, Oscar. Sosyalist şirketlerin denetimi / Antonio de Miranda, Oscar Torras. Havana Üniversitesi. Havana, 1974.

Denetleme Kanunu # 159. Ulusal Denetim Ofisi. Küba, 1995.

Echevarría Hernández, Rogelio. İç Denetim. Rogelio Echevarria Hernandez. Maliye ve Fiyatlar Bakanlığı, 1994.

Evans, James R. ve Lindsay, William M. Yönetim ve Kalite Kontrol. Uluslararası Thomson Editörleri. Meksika, 2000

GestioPolis.com. Kalite standartları. Erişim: www.gestiopolis.com/recursos/documentos/fulldocs/ger/normascalidad.htm

Gómez Avilés, Bismayda. Kalite Yönetimi. Kavramlar, terminoloji ve yaklaşımlar. Küba, 2002

Guimaraes, Sandy ve McKeen (2003) QMJ Cilt 10 Sayı 4. Ekim 2003.

Heckmann, Gerardo Hizmetlerin Kalitesinin Ölçülmesi.

Hernández, Hugo. Kalite nesiller.

Holmes, Arthur W.: Denetim: İlkeler ve Prosedürler. W Arthur Holmes. Hispanoamerica Yayınevi. Meksika 1952

Internetworking Technologies El Kitabı. Bölüm 49. "Hizmet Kalitesi Ağ Oluşturma".

ISO 9000-2000.Kalite yönetim sistemleri. ilkeler ve kelime bilgisi.

Yemin ediyorlar Joseph Moses. Kalite Kontrol Kılavuzu. Joseph Moses Juran. Graw_Hill. 5. Baskı. 2001.

Kalite. 7 Kalite Araçları.

León Lefcovich, Maritus. Kaizen - Kalite, Verimlilik ve Maliyet Azaltmada Sürekli İyileştirme uygulandı.

Mendoza Aquino, José Antonio. Hizmet kalitesinin ölçülmesi.

Microsoft şirketi. "QoS mekanizmalarının özeti ve nasıl birlikte çalıştıkları", 2004.

Denetim ve Kontrol Bakanlığı. MAC Kılavuzu. 2000

Moreno, Joaquín. Şirkette finans. Dördüncü baskı. Meksika, 1989.

Paton, WA Muhasebeci El Kitabı. WA Paton. Meksika Utecha, 1943.

Poblete, Fernando. Denetim Standartları.

Pons Murguía, Ramón. Ders notları Endüstri Mühendisliği Yüksek Lisansı. C. Ramón Pons Murguía

Karar No. 2/97, Ulusal Denetim Ofisi tarafından verilen konferanslar. Küba, 1997

Dergisi »Denetim ve Kontrol» Denetim ve Kontrol Bakanlığı 2001 Sayılı

"Denetim ve Kontrol" Dergisi 4 Nolu Denetim ve Kontrol Bakanlığı 8 Nisan 2003

Dergisi "Denetim ve Kontrol" Denetim ve Kontrol Bakanlığı. Cilt I, No 3. Baskı.

Sanguinetti, Corabel. Analiz ve Sistem Tasarımı.

Universitas Miguel Hernández. Kalite Araçları.

Vilar Barrio, José Francisco. Kalite iyileştirme için 7 yeni araç, 2. baskı.

Weston, J. Fred ve Capeland, Thomas E.Finans ve Yönetim. Dokuzuncu baskı. Meksika, 1996.

Zabaro Babani, León. Denetim ve Kontrol. Leon Zabaro Babani. Eylül –Aralık, 2000.

Eğitim denetim hizmetleri için küme analizi