|
|
|
³¡¾øÀÌ ¿µ»ó »ý¼ºÇÏ´Â AI ºñµð¿À »ý¼º ±â¼ú °³¹ß |
ªÀº Ŭ¸³¸¸ »ý¼ºÇÏ´Â ±âÁ¸ ¸ðµ¨ ÇÑ°è ±Øº¹... ¿µÈ, ±¤°í µî È°¿ë |
|
|
¼¿ï´ëÇб³ °ø°ú´ëÇÐÀº Àü±âÁ¤º¸°øÇкΠÇѺ¸Çü ±³¼ö°¡ ÁöµµÇÏ´Â ÄÄÇ»ÅͺñÀü ¿¬±¸ÆÀ(CVLAB)ÀÌ º°µµÀÇ ÇнÀ ¾øÀÌ ¹«ÇÑÇÑ ±æÀÌÀÇ ºñµð¿À¸¦ »ý¼ºÇÒ ¼ö ÀÖ´Â Çõ½ÅÀûÀÎ ÀΰøÁö´É(AI) ±â¼ú ‘ÇÇÆ÷ µðÇ»Àü(ÀÌÇÏ FIFO-Diffusion)’À» °³¹ßÇß´Ù°í ¹àÇû´Ù.
±âÁ¸ ¿µ»ó »ý¼º ¸ðµ¨ÀÇ ÇѰ踦 ±Øº¹ÇÑ FIFO-DiffusionÀº µðÇ»Àü ¸ðµ¨¿¡ ±â¹ÝÇÑ ºñµð¿À »ý¼º ±â¼úÀÇ »õ·Î¿î ¹æ¹ý·ÐÀ» Á¦½ÃÇß´Ù´Â Æò°¡¸¦ ¹Þ°í ÀÖ´Ù. ÀÌ ±â¼úÀ» Á¦¾ÈÇÑ ³í¹® ‘FIFO-Diffusion: Generating Infinite Videos from Text without Training’Àº Áö³ 10¿ù¿¡ ÀΰøÁö´É ¹× ±â°èÇнÀ ºÐ¾ßÀÇ ÃÖ°í ±ÇÀ§ ±¹Á¦Çмú´ëȸ ‘NeurIPS 2024 (Neural Information Processing Systems, ½Å°æÁ¤º¸Ã³¸®½Ã½ºÅÛÇÐȸ)’ÀÇ ¹ßÇ¥ ³í¹®À¸·Î äÅõŠÇаè¿Í »ê¾÷°èÀÇ ÁÖ¸ñÀ» ¹ÞÀº ¹Ù ÀÖ´Ù. NeurIPS´Â ÀΰøÁö´É ¹× µö·¯´× ºÐ¾ßÀÇ ÃֽŠ¿¬±¸ ¼º°ú¿Í Çõ½ÅÀû ±â¼úÀÌ ¹ßÇ¥µÇ´Â ÀÚ¸®·Î ¸Å³â ¾ö°ÝÇÑ ½É»ç¸¦ Åë°úÇÑ ¿ì¼öÇÑ ³í¹®ÀÌ ¹ßÇ¥ ³í¹®À¸·Î ¼±Á¤µÈ´Ù.
±âÁ¸ÀÇ ºñµð¿À »ý¼º ¸ðµ¨Àº ¿µ»ó ±æÀÌ°¡ ±æ¾îÁú¼ö·Ï ¸Þ¸ð¸® ¼Ò¸ð°¡ ±Þ°ÝÈ÷ Áõ°¡ÇØ ´ë±Ô¸ð Çϵå¿þ¾î ÀÚ¿øÀÌ ÇÊ¿äÇßÀ» »Ó ¾Æ´Ï¶ó ÇÁ·¹ÀÓ °£ ÀÏ°ü¼º À¯Áö¿¡ ¾î·Á¿òÀÌ ÀÖ¾î ºÎÀÚ¿¬½º·¯¿î ¿µ»óÀ» »ý¼ºÇÏ´Â ÇÑ°è°¡ ÀÖ¾ú´Ù. ÀÌ¿¡ ¿¬±¸ÆÀÀº ¸Þ¸ð¸® »ç¿ë·®À» ÀÏÁ¤ÇÏ°Ô À¯ÁöÇϸ鼵µ °¢ ÇÁ·¹ÀÓÀÌ ÀÚ¿¬½º·´°Ô ¿¬°áµÇ´Â ¿µ»óÀ» »ý¼ºÇÏ´Â FIFO-DiffusionÀ» °³¹ßÇß´Ù. ÀÌ È¹±âÀûÀÎ ±â¼úÀº »çÀü¿¡ ªÀº Ŭ¸³À» ÅëÇØ ÈÆ·ÃµÈ µðÇ»Àü ¸ðµ¨ÀÌ Ãß°¡ ÇнÀ ¾øÀÌ ÅؽºÆ® Á¶°Ç¿¡ ¸ÂÃç ¹«ÇÑÇÑ ±æÀÌÀÇ ºñµð¿À¸¦ »ý¼ºÇϵµ·Ï ¼³°èµÆ±â ¶§¹®¿¡ °íÈÁúÀÇ ºñµð¿À¸¦ Àå½Ã°£ »ý¼ºÇÒ ¼ö ÀÖ´Ù.
ƯÈ÷ À̹ø ¿¬±¸¿¡¼´Â ºñµð¿À Ç°Áú °³¼±À» À§ÇØ ¼¼ °¡ÁöÀÇ Çõ½ÅÀû ±â¹ýÀÌ È°¿ëµÅ °ü½ÉÀ» ²ø¾ú´Ù. ¸ÕÀú °¢±â ´Ù¸¥ ³ëÀÌÁî ·¹º§ÀÇ ºñµð¿À ÇÁ·¹ÀÓÀ» ÀÏ·ÃÀÇ Å¥(queue) ÇüÅ·Πµ¿½Ã¿¡ ó¸®ÇÏ´Â ‘´ë°¢¼± µð³ëÀÌ¡(diagonal denoising)’ ±â¹ýÀ» ÅëÇØ µðÇ»Àü ¸ðµ¨ÀÌ Ç°Áú ÀúÇÏ ¾øÀÌ ¹«ÇÑÈ÷ ±ä ºñµð¿À¸¦ »ý¼ºÇÏ´Â °ÍÀ» °¡´ÉÄÉ Çß´Ù. ÀÌ¾î¼ ÇÁ·¹ÀÓÀ» ¿©·¯ ºí·ÏÀ¸·Î ³ª´² º´·Ä ó¸®ÇÏ´Â ‘ÀáÀç ÆÄƼ¼Å´×(latent partitioning)’ ±â¹ýÀ¸·Î ÇÁ·¹ÀÓ °£ ³ëÀÌÁî ·¹º§ Â÷À̸¦ ÁÙ¿´´Ù. ±×¸®°í »õ·Î »ý¼ºµÉ ÇÁ·¹ÀÓµéÀÌ ÀÌÀü¿¡ »ý¼ºµÈ ´õ ±ú²ýÇÑ ÇÁ·¹ÀÓÀ» ÂüÁ¶Çϵµ·Ï ÇÏ´Â ‘¾Õ¼º¸±â µð³ëÀÌ¡(lookhead denoising)’ ±â¼úÀ» µµÀÔÇØ ÈÄ¹Ý ÇÁ·¹ÀÓÀÇ ¼Õ½ÇÀ» °¨¼Ò½ÃÄÑ ´õ¿í ¼±¸íÇÑ ºñµð¿À Ãâ·ÂÀ» ±¸ÇöÇÒ ¼ö ÀÖ¾ú´Ù. ¸¶Áö¸·À¸·Î ¿¬±¸ÁøÀº ºñµð¿À »ý¼º ¼Óµµ¿Í Ç°ÁúÀ» ÇÑ°á ³ôÀÎ ÀÌ ±â¹ýµéÀ» ´ÙÁß GPU¿¡ º´·Ä·Î Àû¿ëÇØ È¿À²¼ºÀ» ±Ø´ëÈÇÔÀ¸·Î½á ¹«ÇÑÈ÷ ±ä ¿µ»óÀ» »ý¼ºÇÏ´Â ºñµð¿ÀÀÇ ½ÇÇö °¡´É¼ºÀ» ÀÔÁõÇß´Ù.
FIFO-Diffusion ±â¼úÀº ÇâÈÄ ¿µÈ, ±¤°í, °ÔÀÓ, ±³À° µî ´Ù¾çÇÑ ÄÜÅÙÃ÷ »ê¾÷¿¡¼ ³Î¸® È°¿ëµÉ °ÍÀ¸·Î ±â´ëµÈ´Ù. ±âÁ¸ÀÇ ÅؽºÆ® ±â¹Ý ºñµð¿À »ý¼º ¸ðµ¨µéÀº 3ÃÊ À̳»ÀÇ ÂªÀº Ŭ¸³¸¸ »ý¼ºÇÒ ¼ö ÀÖ¾î ½ÇÁ¦ ÄÜÅÙÃ÷ Á¦ÀÛ¿¡ ÀÌ¿ëµÇ±â ¾î·Á¿üÁö¸¸, ÀÌ·¯ÇÑ Á¦¾àÀ» ¶Ù¾î³ÑÀº FIFO-Diffusion ±â¼úÀÌ »ó¿ëÈµÇ¸é ±æÀÌ Á¦ÇÑ ¾øÀÌ ´õ ÀÚ¿¬½º·¯¿î ºñµð¿À¸¦ »ý¼ºÇÒ ¼ö Àֱ⠶§¹®ÀÌ´Ù. ¶ÇÇÑ ÇнÀÀ» À§ÇÑ ´ë±Ô¸ð Çϵå¿þ¾î ÀÚ¿øÀ̳ª ¹æ´ëÇÑ µ¥ÀÌÅ͸¦ ÇÊ¿ä·Î ÇÏÁö ¾Ê´Â °Á¡ ´öºÐ¿¡ FIFO-DiffusionÀÌ AI¿¡ ±â¹ÝÇÑ ¿µ»ó ÄÜÅÙÃ÷ Á¦ÀÛÀ» ÇÑÃþ È°¼ºÈÇÒ Àü¸ÁÀÌ´Ù.
¿¬±¸¸¦ ÁöµµÇÑ ÇѺ¸Çü ±³¼ö´Â “±âÁ¸ ºñµð¿À »ý¼º ¸ðµ¨ÀÇ ÇѰ踦 ±ü FIFO-DiffusionÀº º°µµÀÇ ÇнÀ ¾øÀÌ ¹«ÇÑÇÑ ±æÀÌÀÇ ºñµð¿À¸¦ »ý¼ºÇÑ´Ù´Â »õ·Î¿î °³³äÀ» ¼ö¸³Çß´Ù´Â Á¡¿¡¼ Àǹ̰¡ ³²´Ù¸£´Ù”¸ç “ÇâÈÄ ÀÌ ±â¼úÀ» ¹ÙÅÁÀ¸·Î ´Ù¾çÇÑ ÈÄ¼Ó ¿¬±¸¸¦ ÀÌ¾î ³ª°¥ °èȹ”À̶ó°í ¹àÇû´Ù. ³í¹®ÀÇ ÁÖ ÀúÀÚÀÎ ±èÁöȯ ¿¬±¸¿øÀº “À̹ø °³¹ß·Î ºñµð¿À »ý¼º ±â¼úÀÌ ¿µ»ó ÄÜÅÙÃ÷ ºÐ¾ß¿¡¼ Æø³Ð°Ô »ç¿ëµÉ ¼ö ÀÖ´Â Åä´ë°¡ ¸¶·ÃµÆ´Ù”°í ¿¬±¸ÀÇ Àǹ̸¦ ¼³¸íÇß´Ù.
ÇÑÆí ¿¬±¸ ³í¹®ÀÇ °øµ¿ Á¦1ÀúÀÚÀÎ ±èÁöȯ, °ÁØ¿À ¿¬±¸¿øÀº ÇöÀç ¼¿ï´ë ÄÄÇ»ÅͺñÀü ¿¬±¸½Ç¿¡¼ ºñµð¿À »ý¼º ºÐ¾ßÀÇ ÈÄ¼Ó ¿¬±¸¸¦ ½Éµµ ±í°Ô ¼öÇàÇÏ°í ÀÖ´Ù.
Ãâó : ¼¿ï´ëÇб³ °ø°ú´ëÇÐ
|
|
Àüü´º½º¸ñ·ÏÀ¸·Î |
|
|
|
|
|