»ùÒòµÄת¼ÔÚÉúÎïѧÖÐÐÄ·¨ÔòÖд¦ÓÚ³ÐÉÏÆôϵÄÖØÒª»·½Ú£¬ÓëÏà¶Ô¡°¾²Ì¬¡±µÄ»ùÒò×éÏà±È£¬×ªÂ¼×éÔÚ²»Í¬×éÖ¯/Æ÷¹Ù/·¢Óý½×¶Î¾ùÓÐÏÔÖø±ä»¯£¬ÊÇϸ°ûÍê³ÉÏàÓ¦ÉúÀí/²¡Àí¹¦ÄܵÄÖØÒªÉúÎïѧ»ù´¡¡£Ï¸°ûÊǹ¹³ÉÉúÃüµÄ»ù´¡µ¥Ôª£¬Ñ¸ËÙ·¢Õ¹µÄµ¥Ï¸°û²âÐò¼¼ÊõΪÔÚµ¥Ï¸°û²ãÃæÑо¿Ï¸°û¹¦Äܼ°Æä±³ºóµÄ»ùÒòµ÷¿Ø»úÖÆÌṩÁËÖØÒªµÄ¼¼ÊõÊֶΣ¬µ¥Ï¸°û²âÐò¿ÉÓÃÓÚ¼ì²â¶àÖÖ²»Í¬µÄ×éѧÖÖÀ࣬°üÀ¨×ªÂ¼×顢ȾɫÖÊ¿ª·Å×é¡¢DNA¼×»ù»¯×é¡¢×éµ°°×ÐÞÊÎ×éµÈµÈ£¬¶Ô²»Í¬×éѧ¼¼Êõ²úÉúµÄÊý¾Ý½øÐÐÕûºÏ·ÖÎöÓÐÖúÓÚ¸üÈ«ÃæµØ¿Ì»­Ï¸°ûÄڵĻùÒòµ÷¿Ø×´Ì¬¡¢½Òʾµ÷¿Ø»úÖÆ¡£È»¶ø£¬Ó봫ͳµÄbulkÊý¾ÝÏà±È£¬µ¥Ï¸°ûÊý¾Ý¾ßÓйæÄ£´ó£¨°ÙÍò¼¶Ï¸°û£©¡¢ÔëÉù¸ß£¨dropout, batch effect£©¡¢Òì¹¹ÐÔÇ¿µÈÌØµã£¬ÈçºÎͨ¹ý¿ª·¢ÐµļÆËã·½·¨ÊµÏÖ¶ÔÕâЩ±¦¹óÊý¾ÝµÄÓÐЧÀûÓÃÒѳÉΪµ±½ñÉúÎïÐÅϢѧÁìÓò¹Ø×¢µÄÖØµãÓëÈȵã¡£

Õë¶ÔÉÏÊöÌôÕ½£¬2022Äê5ÔÂ2ÈÕ£¬±±¾©´óѧ/²ýƽʵÑéÊҸ߸èÑо¿Ô±¿ÎÌâ×éÓÚ Nature Biotechnology ·¢±íÌâΪ¡°Multi-omics single-cell data integration and regulatory inference with graph-linked embedding¡±µÄÑо¿ÂÛÎÄ£¬Ìá³öÁË»ùÓÚͼñîÁª²ßÂÔµÄÉî¶Èѧϰ·½·¨GLUE£¬Ê×´ÎʵÏÖÁ˶԰ÙÍò¼¶µ¥Ï¸°û¶à×éѧÊý¾ÝµÄÎ޼ල¾«×¼ÕûºÏÓëµ÷¿ØÍƶÏ¡£

µ¥Ï¸°û¶à×éѧÊý¾ÝÕûºÏµÄÒ»´óÌôÕ½ÔÚÓÚ²»Í¬×éѧµÄÌØÕ÷¿Õ¼ä´æÔÚ²îÒ죬ÀýÈçת¼×éµÄÌØÕ÷ÊÇ»ùÒò£¬¶øÈ¾É«ÖÊ¿ª·Å×éµÄÌØÕ÷ÊÇȾɫÖÊ¿ª·ÅÇø¶Î£¬²»Í¬ÌØÕ÷¿Õ¼äµÄϸ°ûȱ·¦¿É±ÈÐÔ¡£ÎªÁ˽â¾öÕâÒ»ÎÊÌ⣬GLUEÌá³öÁËȫеÄͼñîÁª£¨graph-linking£©²ßÂÔ£¬½«×éÑ§ÌØÕ÷¼äµÄÏÈÑéµ÷¿Ø¹ØÏµ±íʾ³ÉÒýµ¼Í¼£¨guidance graph£©µÄÐÎʽ£¬ÆäÖнڵãΪ×éÑ§ÌØÕ÷£¬±ßΪ×éÑ§ÌØÕ÷¼äµÄÏÈÑéµ÷¿Ø¹ØÏµ¡£Ä£ÐͲÉÓñä·Öͼ×Ô±àÂëÆ÷£¨Variational Graph AutoEncoder, VGAE£©Ñ§Ï°×éÑ§ÌØÕ÷µÄµÍά±íʾ×÷Ϊ×éѧÊý¾ÝµÄ½âÂëÆ÷È¨ÖØ£¬´Ó¶ø½«²»Í¬×éѧµÄµÍάÒþ¿Õ¼ä±íʾ¹ØÁªÆðÀ´²¢È·±£Æä¡°ÓïÒåÒ»ÖÂÐÔ¡±£»ÔÚ´Ë»ù´¡ÉÏ£¬GLUE½øÒ»²½ÒýÈë¶Ô¿¹Ñ§Ï°ÒÔÏû³ý²»Í¬×éѧ½µÎ¬±íʾ֮¼äµÄϵͳÐÔ²îÒ죨ͼ1£©¡£

ͼ1 GLUEÄ£Ð͵ĽṹʾÒâͼ

ÓëÆäËü·½·¨Ïà±È£¬GLUEµÄÖ÷ÒªÓÅÊÆ°üÀ¨£º

¶à×éѧÕûºÏµÄ¾«¶È¸ß£º¶à¸öµ¥Ï¸°ûת¼×éÓëȾɫÖÊ¿ª·Å×éÊý¾ÝµÄÕûºÏÆÀ²âÏÔʾ£¬GLUEÎÞÂÛÊÇÔÚϸ°ûÀàÐͲãÃæºÍµ¥Ï¸°û²ãÃæ£¬Ïà±ÈÒÑÓе¥Ï¸°û¶à×éѧÕûºÏËã·¨¾ßÓиü¸ßµÄÕûºÏ¾«¶È£¨Í¼2a¨Cc£©£»

¶ÔÓÚÏÈÑéµ÷¿ØÖªÊ¶¾ßÓг°ôÐÔ£ºGLUEÒýµ¼Í¼ÖÐʹÓõÄÏÈÑéµ÷¿Ø¹ØÏµÎÞÐèÌØ±ð¾«È·£¬ÒÔµ¥Ï¸°ûת¼×éÓëȾɫÖÊ¿ª·Å×éÊý¾ÝÕûºÏΪÀý£¬Ö»Òª½«È¾É«ÖÊ¿ª·ÅÇø¶ÎÓëÁÙ½ü»ùÒòÏàÁ¬¾Í¿ÉÒÔ¹¹½¨ÓÐЧµÄÒýµ¼Í¼£¬ÔëÉùʵÑé±íÃ÷¼´±ã¶ÔÉÏÊöÒýµ¼Í¼Ìí¼Ó´óÁ¿Ëæ»úÈŶ¯£¬GLUEÈÔÄܵõ½ÕýÈ·µÄÕûºÏ½á¹û£¨Í¼2d£©£»

ͼ2 GLUEµÄ¶à×éѧÕûºÏÐÔÄÜÆÀ²â½á¹û

¾ßÓнϸߵļÆËã¿ÉÀ©Õ¹ÐÔ£¨scalability£©£ºGLUEµÄ¼ÆË㸴ÔÓ¶ÈÓëϸ°ûÊýÖ®¼ä³ÊÑÇÏßÐÔ£¨sublinear£©¹ØÁª£¬ÊÇͬÀà·½·¨ÖÐΨһ¿ÉÒÔ¾«×¼·ÖÎöÉϰÙÍòµ¥Ï¸°ûµÄ·½·¨£¨Í¼3£©£»

ͼ3 GLUEÊ×´ÎʵÏÖÁËͼÆ×¼¶³¬´ó¹æÄ£µ¥Ï¸°û¶à×éѧÊý¾ÝµÄ׼ȷÕûºÏ¡£ÓëͬÀ๤¾ßÏà±È£¬GLUEÔÚϸ°û·Ö±æÂÊÓëµþºÏ¾«¶È·½Ãæ¾ù¾ßÓÐÏÔÖøµÄÓÅÊÆ

¿ÉÖ§³ÖÈÎÒâÊýÁ¿¡¢µ÷¿Ø·½ÏòµÄ×éѧÊý¾Ý£ºÍ¨¹ýÒýÈë×éÑ§ÌØÒìµÄ±ä·Ö×Ô±àÂëÆ÷£¨Variational AutoEncoder, VAE£©×é¼þ¶Ñµþ£¬GLUEÖ§³Ö¶Ô¶à×éѧ·ÇÅä¶Ô£¨unpaired£©Êý¾ÝµÄÎ޼ලÕûºÏ¡£×÷Õ߳ɹ¦ÓÃÆäÕûºÏÁËСÊó´óÄÔÉÏÆ¤µÄµ¥Ï¸°ûת¼×顢ȾɫÖÊ¿ª·Å×éºÍDNA¼×»ù»¯×飬²¢ÏÔʾÁËÈý×éѧÕûºÏ¿ÉÒÔÓÐЧµØ¸ÄÉÆÏ¸°ûµÄÀàÐÍ×¢ÊÍ¡£Óë´Ëͬʱ£¬GLUEÔÚÉè¼ÆÉÏÒýÈëÁËÄ£¿é»¯Ë¼Ï룬¿ÉÈÝÒ׵ؽøÒ»²½À©³äÒÔÖ§³ÖÈ絥ϸ°ûRibo-seq¡¢¿Õ¼äת¼×éµÈ¸ü¶à×éѧÀàÐÍÊý¾ÝÕûºÏ£»

¿Éͬʱ½øÐе÷¿ØÍƶÏ£º³ýÁËϸ°û²ãÃæµÄ¿ç×éѧƥÅ䣬ÓÉÓÚGLUEÔÚÏÈÑéµ÷¿ØÍ¼ÖÐÖ±½Ó¶Ôµ÷¿Ø¹ØÏµ½øÐÐÁ˽¨Ä££¬»¹¿É×ÛºÏÏÈÑéµ÷¿ØÐÅÏ¢Óë¶à×éѧÊý¾Ýͳ¼ÆÏà¹ØÐÔ£¬ÊµÏÖ¿É¿¿µÄת¼µ÷¿ØÍƶϣ¬×÷ÕßÒÔÍâÖÜѪÊý¾Ý¼¯ÎªÀý£¬Ó¦ÓÃGLUEÕûºÏÁËpcHi-CÎïÀíÏ໥×÷Óá¢eQTLÍ»±ä±íÐ͹ØÁª¡¢ÒÔ¼°µ¥Ï¸°ûת¼×éÓëȾɫÖÊ¿ª·Å×é×ÊÁÏ£¬²¢Ö¤Ã÷GLUE¿ÉÓÐЧÕûºÏ¶àÖÖµ÷¿ØÖ¤¾ÝÒԵõ½¾«×¼µÄµ÷¿Ø¹ØÁª£¨Í¼4£©¡£ÖµµÃÖ¸³öµÄÊÇ£¬GLUEÒýµ¼Í¼ËùÐèµÄÏÈÑéµ÷¿Ø¹ØÏµÎÞÐèÌØ±ð¾«È·(ÒÔµ¥Ï¸°ûת¼×éÓëȾɫÖÊ¿ª·Å×éÊý¾ÝÕûºÏΪÀý£¬Ö»Òª½«È¾É«ÖÊ¿ª·ÅÇø¶ÎÓëÁÙ½ü»ùÒòÏàÁ¬¾Í¿ÉÒÔ¹¹½¨ÓÐЧµÄÒýµ¼Í¼)£¬ÏµÍ³µÄÆÀ²âÏÔʾGLUE¶à×éѧÕûºÏÓëµ÷¿ØÍƶϾù¾ßÓнÏÇ¿µÄ³°ôÐÔ¡£

ͼ4 GLUE¿É×ÛºÏÏÈÑéµ÷¿ØÖªÊ¶Ó뵥ϸ°û¶à×éѧ¹Û²â½øÐпɿ¿µÄµ÷¿ØÍƶÏ

GLUEÈ«²¿ÊµÏÖ´úÂëÒѾ­¿ªÔ´·¢²¼£¨https://github.com/gao-lab/GLUE£©£¬¿Éͨ¹ýpypIºÍAnacondaƽֱ̨½Ó°²×°Ê¹Óá£

²©Ê¿Éú²ÜÖǽÜΪ¸ÃÂÛÎĵÚÒ»×÷Õߣ¬¸ß¸èΪ¸ÃÂÛÎÄͨѶ×÷Õß¡£¸ÃÑо¿µÃµ½Á˹ú¼ÒÖØµãÑз¢¼Æ»®¡¢µ°°×ÖÊÓëÖ²Îï»ùÒòÑо¿¹ú¼ÒÖØµãʵÑéÊÒ¡¢±±¾©Î´À´»ùÒòÕï¶Ï¸ß¾«¼â´´ÐÂÖÐÐĺͲýƽʵÑéÊÒµÄ×ÊÖú¡£¼ÆËã·ÖÎö¹¤×÷ÓÚ±±¾©´óѧ¸ßÐÔÄܼÆËãУ¼¶¹«¹²Æ½Ì¨ºÍ±±¾©´óѧ̫ƽÑó¸ßÐÔÄܼÆËãÆ½Ì¨Íê³É¡£