Термінологічна база даних WIPO Pearl

Багатомовний термінологічний портал WIPO Pearl, створений досвідченими лінгвістами і термінологами ВОІВ та презентований у вересні 2014 року, надає безкоштовний доступ до величезної кількості багатомовної науково-технічної термінології, що використовується в патентних документах (http://www.wipo.int/wipopearl). WIPO Pearl був запущений для сприяння точному і послідовному використанню наукових і технічних термінів на десяти мовах публікації Договору про патентну кооперацію (PCT).

База даних містить терміни, що використовуються в міжнародних заявках, поданих за системою РСТ, термінологічні колекції, що стосуються інших сфер діяльності ВОІВ, таких як торговельні марки, промислові зразки, угоди й договори, адміністративні функції яких здійснюються ВОІВ, а також юридичну термінологію, що використовується в Договорі РСТ.

На сьогодні термінологічна база даних WIPO Pearl нараховує понад 190 000 патентних термінів, які узгоджені з лінгвістичними експертами WIPO-РСТ.

Науково-технічні терміни можна шукати в 45 різних мовних комбінаціях, пропонуючи можливість пошуку між європейськими та азіатськими мовами, а також між будь-якими з цих мов і арабською. Це робить WIPO Pearl унікальним серед існуючих мовних ресурсів. Для кожного терміна надано контекст, щоб допомогти проілюструвати, що він означає і як він використовується.

Також унікальними для WIPO Pearl є концептуальні карти, які дозволяють користувачеві переглядати знання предметної області, досліджуючи зв’язки між концепціями. Користувачі також мають можливість використовувати інформацію, що відображається в концептуальних шляхах – для проведення комбінованого пошуку за ключовими словами в PATENTSCOPE. Доступ до PATENTSCOPE також можна отримати безпосередньо зі списку результатів, отриманих шляхом проведення традиційного пошуку по терміну в інтерфейсі лінгвістичного пошуку. Крім створення концептуальних карт, створених людьми, WIPO Pearl використовує штучний інтелект для створення так званих концептуальних хмар, що пропонують нові кластери взаємозв’язків між концепціями. WIPO Pearl – перша термінологічна база даних, в якій відображено таке нововведення.

WIPO Pearl також інтегрований з WIPO Translate, розробленою усередині ВОІВ системою машинного перекладу з інноваційною технологією нейронного машинного перекладу на основі штучного інтелекту, щоб пропонувати користувачам пропозиції машинного перекладу, коли термін недоступний на одній з цільових мов.

Так, загалом більше 20 000 понять (82%) пов’язані з іншими поняттями в базі даних і ці зв’язки можна переглянути за допомогою пошуку у «поняттєвій мапі». Подальші взаємозв’язки можуть бути показані в неперевірених «концептуальних хмарах», створених за допомогою алгоритму машинного навчання.

Постійно зростаюча мережа партнерів по всьому світу, включаючи університети і урядові органи, тепер допомагає наповнювати WIPO Pearl новими термінами, в той час як предметні експерти в партнерських установах перевіряють точність термінів в своїй галузі спеціалізації та підвищують оцінку надійності термінів.

За співпрацею з урядом Канади відбулось оновлення, що включає 80 багатомовних термінологічних записів (500 термінів), створених в результаті співпраці між ВОІВ і Відділом стандартизації термінології Бюро перекладів уряду Канади, яке визначило ключову термінологію в революційній області віртуальної реальності. Експертна перевірка термінів і концептуальних карт була проведена фахівцями в цій галузі з Політехнічної школи Монреаля, MasterpieceVR і Університету Макгілла в Канаді.

За співпрацею з університетами було включено багатомовні термінологічні записи, надані студентами Національного університету Кордови (Аргентина), Університету Гренобль-Альпи (Франція), Манчестерського університету (Сполучене Королівство). Крім того, за результатами співпраці з Університетом Іллінойсу (США) термінологічна база поповнилася 60 термінами в галузі телемедицини.

У термінологічну базу даних WIPO Pearl додано близько 1500 нових термінів, пов’язаних з COVID-19, на 10 мовах, що допомагає новаторам, націленим на нові методи лікування і діагностики коронавируса, за допомогою базового набору термінів і їх багатомовних еквівалентів. Це буде сприяти міжнародному співробітництву та сприятиме більш легкому доступу до інформації в патентних документах та інших державних ресурсах, вироблених по всьому світу.

Отже, користувачі за допомогою функції пошук «поняттєвих зв’язків» мають змогу знаходити зв’язки між двома поняттями на будь-якій з 10-ти мов, з відображенням всіх пов’язаних між собою понять, і використовувати всі або деякі з цих термінів та їх синоніми для виконання комбінованого пошуку за ключовими словами у PATENTSCOPE. Так, багатомовна термінологічна база даних надає користувачам доступ до наукових і технічних термінів, вона також сприяє правильному та послідовному їх використанню на різних мовах і спрощує пошук та обмін науково-технічними знаннями.