දුස්තොරතුරුවලට එරෙහිව සටන් කිරීම සඳහා, කෘත්රිම බුද්ධිය (AI) විසින් සාදන ලද රූප හඳුනාගැනීමට ගූගල් සමාගම 'digital watermark' අත්හදා බලමින් සිටියි.
ගූගල්හි කෘත්රිම බුද්ධි අංශය වන DeepMind විසින් වැඩි දියුණු කරන ලද SynthID අදාළ රූප හඳුනාගැනීම සිදු කරනු ඇත.
'watermark' මිනිස් ඇසට හඳුනාගත නොහැකි නමුදු පරිගණකවලට හඳුනාගත හැකි වන ආකාරයට, රූපවල තනි පික්සල තුළට වෙනස්කම් ඇතුළත් හරහා එය ක්රියා කරනු ලබයි.
නමුත් එයට "දැඩි ලෙස වෙනස්කම් සිදුකළ රූප හඳුනාගැනීමට තරම් හැකියාවක් නොමැති" බව DeepMind ප්රකාශ කළේ ය.
තාක්ෂණයේ පරිණාමයත් සමග, සැබෑ රූප සහ කෘත්රිමව ජනනය කරන ලද රූප අතර වෙනස පැවසීම වඩ වඩා ත් සංකීර්ණ වෙමින් පවතින බව, බීබීසී බයිට්සයිස්හි 'AI ද, සැබෑ රූප ද' යන්න විමසන ප්රශ්නාවලියෙන් පෙන්වා දෙයි.
පරිශීලකයින් මිලියන 14.5කට අධික පිරිසක් සිටින බව පවසන Midjourney නම් මෙවලමත් සමග, කෘත්රිම බුද්ධියෙන් රූප ජනනය කරන මෙවලම් ප්රධාන ධාරාවට පැමිණියේ ය.
Midjourney මෙවලම මගින් නිර්මිත රූපයකි
එය ලොව පුරා ප්රකාශන හිමිකම් සහ හිමිකාරිත්වය පිළිබඳ ප්රශ්නවලට තුඩුදෙමින්, සරල උපදෙස් මාලාවක් ලබාදීමෙන් තත්පර කිහිපයක් ඇතුළත රූප නිර්මාණය කර ගැනීමට මිනිසුන්ට ඉඩ ලබාදෙයි.
ගූගල් සමාගමට Imagen ලෙස හැඳින්වෙන ඔවුන්ගේම රූප ජනන මෙවලමක් ඇති අතර, එහි 'watermark' සෑදීමේ සහ පරීක්ෂා කිරීමේ පද්ධතිය අදාළ වන්නේ, එම මෙවල ම භාවිතයෙන් සාදන ලද රූප සඳහා පමණි.
අදෘශ්යමානයි
'watermark' යනු, සාමාන්යයෙන් හිමිකාරිත්වය පෙන්වීමට මෙන් ම අවසරයකින් තොරව රූප පිටපත් කිරීම සහ භාවිත කිරීම අධෛර්යවත් කිරීමට රූපයකට යොදන ලාංඡනයක් හෝ පාඨයකි.
එය බීබීසී ප්රවෘත්ති වෙබ් අඩවියේ භාවිත වන රූපවල ද දක්නට ලැබෙන අතර සාමාන්යයෙන් එය රූපයේ පහළ වම් කෙලවරේ ප්රකාශන හිමිකම් සඳහන් 'watermark' එකක් ලෙස ඇතුළත් කර ඇත.
නමුත් කෘත්රිම බුද්ධිය මඟින් ජනනය කරන ලද රූප හඳුනාගැනීම සඳහා මෙවැනි 'watermark' සුදුසු නොවේ. මන්ද ඒවා පහසුවෙන් සංස්කරණය කිරීමට හෝ ඉවත් කිරීමට හැකි නිසා ය.
තාක්ෂණ සමාගම් විසින් අපයෝජන සිදුවීම ඇතුළත් බවට හඳුනාගන්නා වීඩියෝවලට ඩිජිටල් "ඇඟිලි සලකුණු" නිර්මාණය කිරීම සඳහා හෑෂිං (hashing) නම් ශිල්පීය ක්රමයක් භාවිත කරනු ලබයි. එමඟින්, ඒවා අන්තර්ජාලය හරහා පැතිර යාමට පටන් ගන්නේ නම් හඳුනාගෙන ඉක්මනින් ඉවත් කළ හැකි ය.
ගූගල් සමාගමේ ක්රමවේදයෙන් සාර්ථකව නොපෙනෙන 'watermark' එකක් නිර්මාණය කරන අතර, රූපය සැබෑ ද නැතහොත් පරිගණකයකින් සාදන ලද්දේ ද යන්න ක්ෂණිකව සොයා ගැනීම සඳහා එහි මෘදුකාංගය භාවිත කිරීමට මිනිසුන්ට ඉඩ සලසයි.
DeepMindහි පර්යේෂණ ප්රධානී පුෂ්මීත් කෝලි බීබීසීයට පැවසුවේ, ඔවුන්ගේ ක්රමවේදය රූප වෙනස්කම්වලට භාජනය කරන්නේ කෙතරම් සියුම් ද යත් එය "ඔබට සහ මට, නැතහොත් මිනිසෙකුට ගෝචර නොවන" බව ය.
හෑෂිං මෙන් නොව, රූපය ක්රොප් කිරීමකට හෝ සංස්කරණය කිරීමකට භාජනය කිරීමෙන් පසුව වුව ද, සමාගමේ මෘදුකාංගයට 'watermark' පවතින බව හඳුනාගත හැකියැ යි ඔහු පැවසුවේ ය.
"ඔබට [පින්තූරයක] කලර් එක වෙනස් කරන්න පුළුවන්, කන්ට්රාස්ට් එක වෙනස් කරන්න පුළුවන්, එහෙම නැත්නම් රීසයිස් කරන්නත් පුළුවන්... ඒ මොනවා කළත් DeepMind එකට පුළුවන් ඒක කෘත්රිම බුද්ධියෙන් හදපු එකක් ද නැද්ද කියලා කියන්න."
නමුත් මෙය එහි "පර්යේෂණාත්මක නිකුත් කිරීමක්" බවට ද අවවාද කළ ඔහු, එය කෙතරම් නිරවද්ය ද යන්න පිළිබඳ වැඩිදුර ඉගෙනීම සඳහා, ජනයා එය භාවිතා කරනු ඇතැ යි සමාගම බලාපොරොත්තු වෙයි.
ප්රමිතිකරණය
ජුලි මාසයේ දී, කෘත්රිම බුද්ධිය ආරක්ෂිත ලෙස දියුණු කිරීම සහ භාවිතය සහතික කිරීම සඳහා එක්සත් ජනපදයේ දී ස්වේච්ඡා ගිවිසුමකට අත්සන් කළ ප්රමුඛ පෙළේ කෘත්රිම බුද්ධි සමාගම් හත අතර ගූගල් ද විය. 'watermark' භාවිතාව ක්රියාවට නැංවීම තුළින් පරිගණක යොදාගෙන සාදන රූප හඳුනාගැනීමට මිනිසුන්ට හැකියාව ලබාදීම සහතික කිරීම ගිවිසුමේ අන්තර්ගත විය.
මෙය එම කැපවීම් පිළිබිඹු කරන පියවරක් බව කෝලි පැවසූ නමුත්, Partnership on AI ප්රචාරක කණ්ඩායමේ ක්ලෙයාර් ලීබොවික්ස් පැවසුවේ ව්යාපාර අතර වැඩි සම්බන්ධීකරණයක් තිබිය යුතු බව ය.
"මම හිතන්නේ ප්රමිතිකරණය ක්ෂේත්රයට ප්රයෝජනවත් වේවි," ඇය පැවසුවා ය.
"දැන් සොයායන විවිධ ක්රම තියෙනවා, ඒවායේ බලපෑම අපි නිරීක්ෂණය කළ යුතු යි - වඩා ත් සාර්ථක මොකද්ද කියන එක ගැනත්, ඒවායේ බලපෑම ගැනත් හොඳ වාර්තාවක් ලබාගන්න එක වගේ."
"බොහෝ ආයතන විවිධ ක්රම ගවේෂණය කරමින් ඉන්නේ, ඒකෙන් තත්ත්වය සංකීර්ණ අතට හැරෙනවා. මොක ද අපේ තොරතුරු පද්ධති යම් අන්තර්ගතයක් කෘත්රිම බුද්ධියෙන් ජනන කළා ද යන්න අර්ථ නිරූපණය කරන්නත්, එය ප්රතික්ෂේප කරන්නත් විවිධ ක්රම භාවිත කරන නිසා," ඇය පැවසුවා ය.
මයික්රොසොෆ්ට් සහ ඇමසන් ද, ගූගල් සේම කෘත්රිම බුද්ධිය මඟින් ජනනය කරන ලද අන්තර්ගතයන් මත දියසලකුණු යෙදීමට ප්රතිඥා දී ඇති විශාල තාක්ෂණික සමාගම් අතර වේ.
රූපවලින් ඔබ්බට ගියකල මෙටා සමාගම මේ දක්වා නිකුත්කර නොමැති වීඩියෝ ජනන මෙවලමක් වන Make-A-Video සම්බන්ධයෙන් පළ කර ඇති පර්යේෂණ පත්රිකාවක සඳහන් වන්නේ, කෘත්රිම බුද්ධිය විසින් සිදුකරනු ලබන කටයුතුවල විනිවිදභාවය වෙනුවෙන් ඉදිරිපත් වන ඉල්ලීම් හා සමාන ඉල්ලීම් සපුරාලීම සඳහා ඔවුන්ගේ මෙවලමෙන් ජනනය කරනු ලබන වීඩියෝවලට 'watermark' එක් කරන බව ය.
චීනය මෙම වසර ආරම්භයේ දී, කෘත්රිම බුද්ධිය විසින් ජනිත, 'watermark' නොමැති රූප මුළුමනින් ම තහනම් කළේ ය. අලිබාබා වැනි සමාගම් විසින් එහි ක්ලවුඩ් අංශය නිර්මිත විවිධ පාඨ රූපවලට පරිවර්තනය කිරීමේ මෙවලම වන Tongyi Wanxiang මෙවලම යොදා සිදුකරන නිර්මාණ සඳහා 'watermark' යෙදීම ඇරඹීය.
ටොම් ගර්කන් සහ ෆිලිපා වේන්