Clear Sky Science · tr

ABD Patent Ofis İşlemlerindeki bilimsel atıflardan oluşan bir veri kümesi

· Dizine geri dön

Patent Atıfları Günlük Yenilik İçin Neden Önemlidir

Yeni bir cihaz, ilaç veya temiz enerji teknolojisinden söz edildiğinde, genellikle bunun arkasında bir fikir izi bulunur. Bu izlerin büyük bir kısmı patentlerde ve patentlerin atıfta bulunduğu belgelerde kaydedilir. Bu makale, patent inceleyicilerinin bir buluşun korunmaya değer olup olmadığına karar verirken hangi bilimsel araştırmalara başvurduğunu alışılmadık bir ayrıntıyla ortaya koyan büyük, yeni bir veri kümesini tanıtıyor. İnceleme sürecine açılan bu gizli pencere sayesinde yazarlar, araştırmacılara, politika yapıcılara ve meraklı vatandaşlara bilimsel bilginin gerçek dünya yeniliğini nasıl beslediğini incelemek için yeni bir araç sunuyor.

Figure 1
Şekil 1.

Patent Sürecinde Gizli Bir Katman

Patentlerle ilgili yapılan çoğu çalışma sadece verilmiş patentlerin ön sayfasında basılı olan atıflara bakar. Bu listeler basit görünse de, başvuranlarla devlet inceleyicileri arasındaki karmaşık bir ileri‑geri sürecin sonucudur. Bu süreçte inceleyiciler, bir patentin neden kabul edilmesi veya reddedilmesi gerektiğini açıklayan ve önemli buldukları önceki çalışmalara atıfta bulunan resmi yazılar olan Ofis İşlemleri (Office Actions) yayınlar. Bu atıfların çoğu, özellikle bilimsel makaleler, nihai patentte hiç görünmez. Bugüne dek bu kayıtlar toplu olarak erişmesi zordu; bu da araştırmaların kararların gerçekte nasıl alındığına dair bu zengin kaydı büyük ölçüde göz ardı etmesine yol açtı.

Ofis İşlemlerinden Yeni Bir Harita İnşa Etmek

Yazarlar, ABD Patent ve Marka Ofisi tarafından yayımlanan ve Google Cloud üzerinde barındırılan bir Ofis İşlemleri veri hazinesinden yararlanıyor. Milyonlarca referanstan, diğer patentlere işaret etmeyen ve bunun yerine dergi makaleleri, kitaplar, web siteleri ve ürün kılavuzları gibi dış kaynaklara atıfta bulunan yaklaşık 850.000 kaydı izole ediyorlar. Kitaplardan konferans bildirilerine, web sayfalarından ürün dokümantasyonuna kadar uzanan 14 günlük kategori içeren bir şema tasarlıyor ve ardından her atfı bu türlerden birine ayırmak için bir makine öğrenimi modeli eğitiyorlar. Gelişmiş bir dil sistemi yardımıyla etiketlenmiş örneklerle iyileştirilen bu model, yaklaşık 847.000 benzersiz atıf dizisini sınıflandırıyor.

Dağınık Referanslardan Temiz Araştırma Kayıtlarına

Hangi atıfların bilimsel olduğunu belirlemek sadece ilk adım. Gerçek dünyadaki referanslar karmaşıktır: başlıklar eksik olabilir, yıllar yanlış yazılabilir ve sayfa numaraları karışık olabilir. Bu düğümü kullanılabilir verilere dönüştürmek için ekip, ham dizeleri yazar, yıl, dergi ve sayfa aralığı gibi parçalara ayıran özel bir araca besliyor ve dikkatli temizleme kuralları uyguluyor. Ardından bu temizlenmiş kayıtları iki stratejiyle araştırma yayınlarının büyük açık veritabanı OpenAlex ile eşleştiriyorlar. Başlık mevcutsa başlığa göre arama yapıyor ve yalnızca yüksek güven skoruna sahip eşleşmeleri kabul ediyorlar; başlık yoksa yazar isimleri, dergi, yıl ve sayfa kombinasyonlarına dayanıyorlar. OpenAlex bir eşleşme bulamazsa, başka bir önemli yayın tanımlayıcısı kaynağı olan Crossref'e başvuruyor ve bulunan dijital nesne tanımlayıcıları (DOI) kullanılarak tekrar OpenAlex'e geri dönüyorlar.

Yeni Veri Kümesi Ne Kadar Güvenilir?

Bu kaynağın gelecekteki çalışmaları desteklemesi amaçlandığı için yazarlar doğruluğunu test etmeye önemli çaba harcıyor. Sınıflandırıcı, genel olarak referansları doğru türe yaklaşık %92 oranında atıyor ve en yaygın sınıflar olan dergi makaleleri ve patentlerde özellikle iyi performans gösteriyor. Eşleştirme adımı için yapılan elden kontroller, başlığa dayalı aramaların eşleşme skoru yükseldikçe daha doğru hale geldiğini ve en iyi grupta %90'ların ortalarına ulaştığını; ayrıntılı meta veriye dayalı aramaların örneklemede %99 doğruluk gösterdiğini ortaya koyuyor. Crossref aracılığıyla kurtarılan kayıtların çapraz kontrolleri de neredeyse mükemmel uyum gösteriyor. Yazarlar nadir kategoriler—tezler veya teknik raporlar gibi—gibi zayıf noktalarda şeffaf davranıyor ve kullanıcıları gerektiğinde bu alanları geliştirmeye teşvik ediyor.

Figure 2
Şekil 2.

Bilimin Teknolojiyi Nasıl Sürdüğünü İncelemenin Yeni Yolları

Tamamlanan veri kümesi, Ofis İşlemlerinden yaklaşık 265.000 bilimsel referansı tek tek ABD patent başvurularına ve OpenAlex'teki zengin yayın kayıtlarına bağlıyor. Bu, araştırmacıların yeni tür sorular sormasına olanak tanıyor: Farklı inceleyici grupları veya teknoloji alanları bilimsel makalelere ne kadar dayanıyor? Hangi çalışmalar inceleme sırasında önemli kabul edilip nihai patentte kayboluyor? Başarısız olan patentler, başarılı olandan farklı bir bilimsel kayıt dilimine mi dayanıyor? Tüm kod ve veriler açıkça yayımlandığı için başkaları araçları uyarlayabilir, kapsama alanını genişletebilir ve sınıflandırmaları rafine edebilir. Basitçe söylemek gerekirse, bu çalışma, yasal belgelerin dağınık ve belirsiz kümesini patent sisteminin içinde bilim ile teknolojinin nasıl buluştuğuna dair açık, yeniden kullanılabilir bir haritaya dönüştürüyor.

Atıf: Higham, K., Kotula, H., Scharfmann, E. et al. A dataset of scientific citations in U.S. patent Office Actions. Sci Data 13, 325 (2026). https://doi.org/10.1038/s41597-026-06720-7

Anahtar kelimeler: patent atıfları, ofis işlemleri, bilimsel literatür, yenilik verisi, OpenAlex