গুগলের ডিপমাইন্ড এআই টিম শেষ পর্যন্ত তাদের জৈবিক প্রচেষ্টার বিস্তারিতভাবে বর্ণনা করার এক সপ্তাহ পরে, সংস্থাটি একটি নথি প্রকাশ করেছে যাতে এটি ব্যাখ্যা করে যে এটি কীভাবে মানব জিনোমে এনকোডযুক্ত প্রতিটি প্রোটিনকে বিশ্লেষণ করে এবং ত্রি-মাত্রিক কাঠামোর পূর্বাভাস দেয় – এমন একটি কাঠামো যা সমালোচনামূলক হতে পারে। রোগ এবং নকশা চিকিত্সা বুঝতে। খুব অদূর ভবিষ্যতে, এই সমস্ত কাঠামোটি ক্রিয়েটিভ কমন্স লাইসেন্সের আওতায় ইউরোপীয় ইনস্টিটিউট অফ বায়োইনফরম্যাটিক্সের মাধ্যমে প্রকাশ করা হবে, যেখানে প্রোটিন কাঠামোর একটি প্রাথমিক ডাটাবেস রয়েছে।

সংবাদপত্র প্রকাশের বিষয়ে এক সংবাদ সম্মেলনে ডিপমাইন্ডের ডেমিস হাসাবিস স্পষ্ট জানিয়ে দিয়েছিলেন যে সংস্থাটি সেখানে দাঁড়িয়ে নেই। নিবন্ধে বর্ণিত কাজ ছাড়াও, সংস্থাটি 20 টি বড় গবেষণা জীবের জিনোমগুলির জন্য খামির থেকে ফল উড়ে ইঁদুর পর্যন্ত কাঠামোগত ভবিষ্যদ্বাণী প্রকাশ করবে। মোট, ডাটাবেস উপস্থাপনা প্রায় 350,000 প্রোটিন কাঠামো কভার করবে।

কাঠামোর মধ্যে কী আছে?

আমরা গত সপ্তাহে সবেমাত্র ডিপমাইন্ড প্রোগ্রামটি বর্ণনা করেছি, সুতরাং আমরা এখানে খুব বেশি বিশদে যাব না। প্রচেষ্টা একটি এআই-ভিত্তিক সিস্টেম যা পরীক্ষাগার পরীক্ষাগুলি (প্রায়শই শ্রমসাধ্যভাবে) দ্বারা নির্ধারিত হিসাবে বিদ্যমান প্রোটিনগুলির কাঠামোর উপর প্রশিক্ষণপ্রাপ্ত। প্রোটিনের অ্যামিনো অ্যাসিড চেইন কীভাবে ত্রি-মাত্রিক স্থানে ভাঁজ হবে তা অনুমান করতে সিস্টেমটি বিবর্তন সম্পর্কিত প্রোটিন পরিবারগুলির এই শিক্ষা এবং তথ্য ব্যবহার করে।

ফলস্বরূপ ত্রি-মাত্রিক কাঠামো কীভাবে একটি প্রোটিন অন্যান্য প্রোটিন এবং রাসায়নিকগুলির সাথে মিথস্ক্রিয়া করে এবং যেখানে প্রোটিন রাসায়নিক বিক্রিয়া ঘটে তা নিয়ে গুরুত্বপূর্ণ তথ্য সরবরাহ করতে পারে। কাঠামোটি ব্যবহার করে গবেষকরা অধ্যয়ন করতে পারেন যে কীভাবে নির্দিষ্ট মিউটেশনগুলি প্রোটিনের কার্যকারিতা পরিবর্তন করে, যেমন জিনগত রোগের কারণগুলি cause গবেষকরা এগুলি কেমিক্যাল ডিজাইন করতেও ব্যবহার করতে পারেন যা কাঠামো, প্রোটিন এবং পরিবর্তনের ক্রিয়াকলাপের সাথে যোগাযোগ করতে পারে যা ক্যান্সার এবং এইচআইভির বিভিন্ন ধরণের চিকিত্সার দিকে পরিচালিত করে।

সাধারণত, এই কাঠামোগুলি প্রোটিনকে বিচ্ছিন্ন করে, ইমেজিংয়ের জন্য এটি প্রস্তুত করে এবং ইলেক্ট্রন দিয়ে বোমাবর্ষণ করে নির্ধারিত হয়। এই পদ্ধতিগুলি কঠিন এবং সময় সাপেক্ষ এবং প্রায়শই ব্যর্থ হয়। গবেষণাপত্রটি অনুমান করে যে কয়েক দশক গবেষণাগারের কাজ আমাদের কেবলমাত্র 17 শতাংশ মানব প্রোটিনের জন্য কাঠামোগত তথ্য সরবরাহ করেছে।

এটি ব্যাখ্যা করে যে গবেষকরা অ্যামিনো অ্যাসিডগুলি তৈরি করে ব্যতীত অন্য কিছু ব্যবহার না করে প্রোটিনগুলির গঠনের পূর্বাভাস দেওয়ার জন্য কয়েক দশক ধরে অনুসন্ধান করে যাচ্ছেন। তবে আলফাফোল্ডের আগে, প্রোগ্রামটির যথার্থতা ধারাবাহিকভাবে কার্যকর হওয়ার পক্ষে যথেষ্ট ছিল না।

মানব প্রোটিন সংগ্রহ

ডিপমাইন্ড মানব জিনোমে প্রতিটি প্রোটিনের কাঠামোর পূর্বাভাস দেওয়ার চেষ্টা করেননি; কিছু আরামে হ্যান্ডেল করার জন্য খুব সহজ। (সংস্থাটি ২,7০০ অ্যামিনো অ্যাসিডের আকার নির্ধারণ করেছে, যা দুর্ভাগ্যক্রমে আমি জিনের চেয়ে ছোট যা আমি নথির পরবর্তী পোস্টটির ক্লোনিংয়ের অংশটি ব্যয় করেছি। অনুমান করা হয় যে এগুলির মধ্যে কিছু প্রোটিন কেবলমাত্র মানব জিনোমে ডিএনএ সিকোয়েন্স বৈশিষ্ট্যের ভিত্তিতে বিদ্যমান।

গুরুত্বপূর্ণভাবে, আলফাফোল্ডের মধ্যে একটি আত্মবিশ্বাসের মূল্যায়ন অন্তর্ভুক্ত রয়েছে যা ভবিষ্যদ্বাণীগুলি কতটা সঠিক হবে তা রেকর্ড করে। এই সব বলার পরে, প্রোগ্রামটি নিশ্চিত করে যে এটি প্রায় pred০ শতাংশ অ্যামিনো অ্যাসিডের পূর্বাভাস দেয় এবং একটি তৃতীয়াংশের চেয়ে কিছুটা বেশি চিহ্নিত করে। অন্য কথায়, গবেষকদের একটি দৃinc় ভবিষ্যদ্বাণী রয়েছে যে মানব প্রোটিনের 40 শতাংশেরও বেশি কাঠামো রয়েছে। স্পষ্টতই, এর অর্থ হল যে আমাদের মানব প্রোটিনের একটি ভাল সেট রয়েছে বলার আগে অনেক কাজ করা দরকার। কিন্তু এখনও আছে অনেক আমাদের প্রকৃত কাঠামো 18 শতাংশেরও বেশি।

প্রোটিনগুলির একটি বিস্তৃত সংগ্রহ রয়েছে যা বিদ্যমান কাঠামোগুলি দ্বারা ভালভাবে প্রতিনিধিত্ব করে না। যে কোনও কোষের ঝিল্লিতে প্রবেশ করে তাদের সাথে বিচ্ছিন্ন হয়ে কাজ করা এবং কাজ করা কঠিন, তাই গবেষকরা এই ঝিল্লি প্রোটিনগুলির অনেকগুলি কাঠামো সমাধান করেন নি। যাইহোক, প্রশিক্ষণের ডেটাতে কয়েকটি উদাহরণ সত্ত্বেও, আলফাফোল্ড দেখায় যে এটি কাঠামোগত যুক্তিসঙ্গতভাবে পরিচালনা করে।

সিস্টেমটি কোন সমস্যার মুখোমুখি হয়? সহজভাবে প্রচুর প্রোটিন একটি নির্দিষ্ট কাঠামো তৈরি করবেন না– প্রকৃতপক্ষে, তাদের ফাংশনটি কাজ করার জন্য সম্পূর্ণ নমনীয় কাঠামোর উপর নির্ভর করে। স্পষ্টতই, এখানে কোনও কাঠামোর সঠিক ভবিষ্যদ্বাণী করা কঠিন, কারণ এই প্রোটিনগুলির (বেশিরভাগই প্রোটিন ভগ্নাংশ) উপস্থিত নেই) এমন অনেক প্রোটিন রয়েছে যা কেবলমাত্র অন্য প্রোটিন বা কোনও রাসায়নিকের সংস্পর্শে এলে তাদের গঠন অর্জন করে। যেহেতু আলফাফোল্ডের কাছে এই তথ্য নেই, তাই এটি করার মতো খুব বেশি কিছু নেই।

সামগ্রিকভাবে, ডিপমাইন্ড দলটি খুঁজে পেয়েছিল যে তারা অনিয়মিত অঞ্চলগুলির জন্য আলফাফোল্ডের পূর্বাভাসের উপর খুব কম আস্থা রেখেছিল এবং তারা এই তথ্যটি এমন প্রোটিন সাইটগুলি সনাক্ত করতে ব্যবহার করতে পারে যেগুলি অনঠনযুক্ত হতে পারে।

এঁরা সকলেই সামাজিকীকরণ করছেন

অদূর ভবিষ্যতে (সম্ভবত আপনি এটি পড়বেন) এই সমস্ত তথ্য একবারে উপলভ্য হতে পারে একটি বিশেষ ওয়েবসাইট ইউরোপীয় ইনস্টিটিউট অফ বায়োইনফরম্যাটিক্স দ্বারা হোস্ট করা, একটি ইউরোপীয় ইউনিয়নের অর্থায়নে পরিচালিত একটি সংস্থা যা নিজের অংশের বর্ণনা করে: “আমরা নিখরচায় বিশ্বের সামাজিক জৈবিক তথ্য বৈজ্ঞানিক সম্প্রদায়ের কাছে বিভিন্ন পরিষেবা এবং সরঞ্জামের মাধ্যমে উপস্থাপন করি।” আলফাফোল্ড ডেটা বাদ দেওয়া হবে না; উপরের লিঙ্কটি লাইভ থাকাকালীন যে কোনও মানুষ এটির যে কোনও মানব প্রোটিন সম্পর্কে তথ্য ডাউনলোড করতে ব্যবহার করতে পারেন।

বা উপরে হিসাবে উল্লিখিত হিসাবে একটি মাউস, খামির বা ফল উড়ে সংস্করণ। 20 টি জীব যা তাদের ডেটা সম্প্রচার দেখতে পাবে তাও কেবল শুরু। ডিপমাইন্ডের ডেমিস হাসাবিস জানিয়েছেন, আগামী কয়েক মাসের মধ্যে এই গ্রুপটি ডিএনএ ডাটাবেসে প্রাপ্ত প্রতিটি জিনের অনুক্রমকে লক্ষ্য করবে। এই কাজটি শেষ হওয়ার সাথে সাথে, 100 মিলিয়নেরও বেশি প্রোটিনের অনুমানযোগ্য কাঠামো হওয়ার আশা করা হয়েছিল। “আমরা মনে করি বিজ্ঞানকে আজ অবধি বিজ্ঞানের পক্ষে এটি সবচেয়ে গুরুত্বপূর্ণ অবদান বলে আমরা মনে করি,” অংশবিশেষে হাসাবিস বলেছেন। অন্যথায়, তর্ক করা কঠিন হবে।

অর্থাৎ এখনও কিছু বিষয় সমাধান করতে হবে। নিঃসন্দেহে, সময়ের সাথে সাথে অ্যালগরিদম উন্নত হবে, তাই মূল ডাটাবেসে সংস্করণটি আপডেট এবং প্রস্তুত করার জন্য একটি ব্যবস্থা থাকা উচিত। ডিপমাইন্ডও করেছিলেন আলফাফোল্ড ওপেন সোর্স কোড, সুতরাং কাঁটাচামচ এবং অন্যান্য জটিলতার সম্ভাবনা রয়েছে।

তবে এই সমস্যাগুলি ভবিষ্যতের জন্য উদ্বেগজনক। আপাতত, আমরা সকলে বসে বসে গ্রহের প্রতি প্রতিটি জীববিজ্ঞানীর সেবা করার টান দেখতে পারি যারা গ্রহগুলির আগ্রহের কোনও প্রোটিনের একটি উচ্চ মানের কাঠামো আছে কিনা তা জানতে চায়।

(আপনার নম্র লেখক ব্যতীত, কারণ আমার প্রোটিনের পছন্দটি ক্রুদ্ধভাবে বড়)

প্রকৃতি, 2021. ডিওআই: 10.1038 / s41586-021-03828-1 (ডিওআই সম্পর্কে)