Crypto asset taxonomy classification and crypto newssentiment analysis


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Orta Doğu Teknik Üniversitesi, Fen Bilimleri Enstitüsü, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2020

Tezin Dili: İngilizce

Öğrenci: OZAN KÖSE

Danışman: Pınar Karagöz

Özet:

Haziran 2020 itibariyle 1900'den fazla kripto para birimi ticareti yapılmakta ve bu sayı hızlıca artmaktadır. Mevcut kripto ticareti senaryosunda, kripto para birimleri birçokları tarafından yatırım araçları olarak görülse de, her kripto varlığı önceden belirlenmiş bir iş modeli içinde belirli bir sektörde çalışmak üzere tasarlanmış durumdadır. Bir kripto varlığını diğerinden ayıran birçok özellik vardır ve bu özelliklere bağlı olarak her bir kripto varlığını farklı şekilde etkileyen çok sayıda iç ve dış faktör bulumaktadır. Kripto para yatırımcıları bu faktörlerden ve özelliklerden yararlanabilir ve bu göstergeleri farklı ticaret stratejileri oluşturmak için kullanabilirler. Biz bu tezde, yatırımcılara rehberlik etmek için kripto varlıklarını çeşitli özellikler altında sınıflandırdık ve kripto paralarla ilgili haberlerde duygu analizi yaptık. İlk büyük görevimiz olarak, açık kaynaklardan topladığımız veriler yoluyla kripto para birimlerinin sektör, işlem anonimliği ve varlık türü açısından otomatik olarak sınıflandırılmasına odaklandık. Bu amaçla, çeşitli kaynaklardan bilgi toplayarak işaretlenmiş bir veri kümesi oluşturduk. Toplanan bu veri kümesi, sektör, varlık türü ve işlem gizliliği etiketleriyle, kripto para birimi hakkındaki yazılı açıklamaları, tanımları içermektedir. Sınıflandırma problemini çözmek için, bölme ve fethetme odaklı bir denetimli öğrenme yaklaşımını kullandık ve modelin performansını bu üç özellik için birkaç denetimli öğrenme algoritmasıyla karşılaştırdık. İkinci büyük görevimiz olarak, kripto varlıklarla ile ilgili haberlerin haber başlığı, özeti ve içeriği üzerine otomatik duygu analizine odaklandık. Bunun için, öncelikle çeşitli açık haber kaynaklarından toplanan işaretlenmiş bir haber veri seti oluşturduk. Bu veri setini, finansal duygu analizi görevinde başarılı olmuş bir sinir ağı modeline ince ayar yapmak ve performansını çeşitli sözlük tabanlı yöntemlerle karşılaştırmak için kullandık.