谷歌浏览器插件
订阅小程序
在清言上使用

Evaluation of Dissimilarity/Distance Coefficients of Binary Data: A Simulation Study

Turkiye Klinikleri Journal of Biostatistics(2022)

引用 0|浏览0
暂无评分
摘要
Amaç: Bu çalışmanın amacı, 2 sonuçlu veriler ile ilgili türetilmiş veri setleri kullanarak farklı değerleri için belirlenen 23 farklı uzaklık katsayısını tanıtmak, özelliklerini ortaya koyarak değerlendirmektir. Gereç ve Yöntemler: Bu çalışmada, 2 sonuçlu veriler için ileri sürülen uzaklık katsayıları ele alınmıştır. Çalışmada Phyton-random kütüphanesi 10≤n≤1000 kullanılarak aralığında yer alan 35 farklı n değeri için veri türetilmiştir. Verilerin türetilmesinde önce a,b,c ve d ile gösterilen gözelerden hangisine değer atanacağı sonra da ilgili gözeye atanacak değer belirlenmiştir. n=10 için 286, n=15 için 815 ve n≥20 için biner farklı veri seti çalışmada kullanılmıştır. Bulgular: İki sonuçlu veriler için tüm farklılık/uzaklık katsayılarının değer aralığının 0 (benzerlik yok) ile 1 (tam benzerlik) olması beklenmesine rağmen tüm katsayılar için bu aralık geçerli değildir. Dikkate alınan 23 farklı katsayı içerisinden 12 tanesi bu aralıkta değer almaktadır. Hiyerarşik kümeleme analizine göre farklılık/uzaklık katsayılarının çoğu birbirine benzemektedir. Sonuç: Genel olarak hemen tüm katsayılara ait değerler, örnekler daha benzer hâle geldikçe sabit bir minimumdan sabit bir maksimuma doğru artmaktadır. Ancak Sokal-Michener, Hamming ve varyans katsayıları, tüm değerleri için farklılık/uzaklık ile doğrusal olarak sorunsuz bir şekilde artmaktadır. Değer aralığının 0-1 olması ve farklılık/uzaklık artışı ile paralellik göstermesinden dolayı Sokal-Michener tarafından önerilen katsayı tüm katsayılar içerisinde öne çıkmaktadır. Cosine, Hamming, Euclid I ve Euclid II katsayıları n sayısından etkilenmekte diğer katsayılar etkilenmemektedir. Dolayısıyla farklılık/uzaklık katsayılarının önemli bir kısmının örnek büyüklüğünden bağımsız oldukları belirlenmiştir.
更多
查看译文
关键词
binary data,dissimilarity/distance coefficients
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要