Android 뉴스 
모바일 시장의 숨은 강자, 'ARM Cortex-A8'
작성자
작성일 2009-06-30 (화) 16:42
ㆍ추천: 0  ㆍ조회: 5796      
IP: 61.xxx.58
PC에서 가장 많이 사용되는 프로세서는 어떤 것일까? 이런 질문을 받으면 별로 고민할 필요도 없이 ‘x86 계열의 프로세서’라고 답할 분들이 많을 것이다. X86 계열의 프로세서는 현재 압도적인 물량을 자랑하는 데스크톱 PC와 노트북 PC의 대부분에 채택되고 있으며, 엔트리급 서버와 ‘울트라 모바일’급 디바이스에도 장착되고 있다.
하지만 질문을 바꿔서 ‘가장 많이 사용되는 프로세서는 무엇일까?’ 라고 하면, 이 때는 다소 답변이 망설여진다. 여기서는 X86 프로세서라고 답을 할 수가 없다. X86 프로세서는 엄밀히 말해 ‘특정 영역’에서 강한 프로세서이기 때문이다. 그리고, 가장 많이 사용되는 프로세서에 가장 가까운 답은 ‘ARM 계열의 프로세서’ 이다.
ARM 계열의 프로세서는 주위에서도 흔하게 찾아볼 수 있다. ARM 계열 프로세서는 수많은 주문형 반도체(ASICs)나 시스템-온-칩(SOC) 등에 채용되어 사용되고 있으며, 주위에서도 흔하게 찾아볼 수 있다. 최근 인기가 높은 스마트폰이나 PDA 뿐 아니라, 대부분의 휴대전화와 MP3P, PMP 부터 카메라, 휴대용 게임기, 산업용 기계 등 다양한 분야에서 ARM 프로세서가 사용되고 있다.
현재 시장에서는 다양한 버전의 ARM 아키텍처를 사용한 제품들을 볼 수 있다. 이 중 Cortex-A8 프로세서는 가장 최신 버전인 ARMv7 아키텍처를 사용하고 있으며, 높은 클럭과 함께 고성능, 저전력 특징이 돋보이며, 다양한 디바이스들이 이 프로세서를 사용하고 있다.


▲ 최근 주력 칩으로 부상하는 'Cortex-A8'은 ARMv7 아키텍처에 근간을 두고 있다.


▲ Cortex-A8의 특징은 ‘실용적인 성능’
최근 모바일 디바이스들에 요구되는 덕목은 나날이 늘어나고 있다. 사용자들은 이제 모바일 디바이스에 단순히 소리나 정지 영상을 보는 수준이 아니라, 인터넷과 연결되어 간단한 작업을 하고 게임과 멀티미디어를 즐길 수 있을 정도의 성능을 원하고 있으며, 더불어 ‘더 오래’ 즐기고자 한다.
Cortex-A8은 높은 성능을 제공하는 어플리케이션 프로세서다. 13스테이지의 슈퍼스칼라 파이프라인 구조를 사용하여 클럭은 최대 1GHz 이상, 성능은 최대 2000+DMIPS 이상을 제공한다. 대략 MHz당 2.0DMIPS 정도의 성능을 내며, 이는 예전 세대에 비해 높은 효율이다. 또한 가변적으로 구성 가능한 내장 L2 캐시는 성능을 더 끌어올려 준다.
Cortex-A8은 ‘고성능’과 ‘저전력’을 잡기 위해 세 가지 핵심 기술이 들어가 있다. ‘Thumb-2’ 기술은 이미 ARMv6 계열인 ARM1156에서부터 찾아볼 수 있는 기술이며, 예전 ARMv4 시절부터 프로세서의 효율을 높이기 위해 사용된 ‘Thumb’ 기술을 좀 더 발전시킨 기술이다. 기존 Thumb 코드에 비해 30% 정도의 성능 향상이 있다.


▲ NEON 기술은 ‘멀티미디어’를 위해 만들어졌다.
‘NEON’은 멀티미디어를 위한 단축 명령어 세트이다. 64, 128비트 SIMD 명령어 세트로 구성되어 있으며, ARMv6에 들어간 SIMD에 비해 두 배 이상의 성능을 보여준다. NEON을 사용할 경우 단 10MHz의 동작 속도로도 MP3 디코딩이 가능하며, 13MHz 이내에서 GSM AMR 코덱을 동작시킬 수 있다. ‘TrustZone’은 모바일 기기에서 사용되는 다양한 보안 관련 기술을 지원하며, 현재 폭넓은 업계의 지원을 받고 있다.
전 세대인 ARMv6 기반 ARM1176 프로세서와의 성능 비교에서 Cortex-A8은 모든 면에서 성능 향상이 있다. 특히 EEMBC/컨슈머 영역에서 큰 성능 향상이 있으며, 상대 성능은 2.7배 이상이다. 기본 성능 자체도 약 1.6배 이상이며, 이는 Cortex-A8에 채용된 NEON 기술을 사용하지 않은 결과이므로 이를 사용해 최적화할 경우 차이는 더 크게 벌어질 것으로 보인다.
NEON 기술은 프로세서 차원에서 다양한 멀티미디어를 지원하기 위한 단축 명령어 기술이다. X86 프로세서들에서도 이와 비슷한 개념으로 MMX, SSE가 있으며, 이런 기술을 사용할 경우 반복적인 명령어가 많이 처리되는 멀티미디어 어플리케이션에서 큰 성능 개선을 얻을 수 있다. 대표적인 예로, VoIP 등의 음성 처리, 동영상과 게임 등에서 큰 성능 개선을 볼 수 있다.
NEON 기술은 멀티미디어 처리에서 그 진가가 드러난다. 멀티미디어의 영역은 대단히 넓으며, 지금도 계속 넓어지고 있다. 예전에는 생각지도 못했던 웹 기반 스트리밍 기술은 이제 완전히 자리를 잡았고, 지금도 계속 새로운 기술이 나오고 있다. NEON은 다양한 영역의 멀티미디어 기술을 유연하게 가속함을 목표로 한다.


▲ NEON 기술을 사용할 경우, 강력한 멀티미디어 성능을 확보할 수 있다.
NEON 기술이 제공하는 명령어 셋을 사용할 경우, ARM11과 비교했을 때 BDTI 비디오 디코드 성능에서 2.2배, OpenMAX DL AAC 디코드 성능은 1.6배 높은 클럭당 성능을 얻을 수 있다. 기본적으로 ARM11과 Cortex-A8의 클럭 차를 생각해 볼 때, 실제 사용자가 느끼는 체감 속도 차는 이보다 훨씬 크다.
이 성능을 실제 사용에 대입할 경우, Cortex-A8은 400MHz 정도의 클럭으로 VGA 해상도와 초당 30프레임, 1Mbps의 대역폭을 가지는 H.264 영상을 소화해낼 수 있으며, 완전한 소프트웨어 렌더링으로 CIF 해상도의 Quake 2를 30fps로 소화하는 데는 265MHz 정도로도 충분하다. 이는 예전 ARM 프로세서들에서 별도의 그래픽 가속기가 없이는 소화하기 힘든 수준이었다.


▲ ARM의 위력은 ‘모바일’에서 잘 나타난다.


▲ ARM의 영역은 점점 더 넓어지고 있는 추세.
ARM 기반 프로세서의 위력은 모바일에서 잘 나타나고 있다. 이미 ARM 기반 모바일 디바이스는 100억대 이상 보급되어 있으며, 2.6억개의 ARM 기반 칩이 2008년에 출고되었다. 그 영역 또한 휴대전화부터 엔트리급 PC까지 다양하게 분포하고 있다.
특히 ‘넷북’이라 불리는 엔트리급 시장에서 약진이 돋보이는데, 200달러 미만의 초저가 시장에서 ARM 기반 시스템은 강력한 가격 경쟁력을 앞세워 생각보다 높은 시장 점유율을 가지고 있다.
ARM의 장점으로는 폭넓은 OS 지원이 있다. 이미 마이크로소프트의 PocketPC 플랫폼은 전통적으로 ARM 기반 디바이스를 중심으로 움직이고 있으며, 그 이외에도 심비안, 구글 안드로이드 등의 모바일 디바이스용 OS가 ARM 플랫폼을 지원하며, 데비안이나 우분투 등 유명한 리눅스 배포판들도 ARM 지원을 밝히고 있다.
ARM11에 비해 대폭 향상된 성능은 이제 Cortex-A8을 엔트리급 PC 플랫폼까지 넘볼 수 있게 만들었다. 지금까지 ARM이 PC 플랫폼에 진입하는 데 있어 가장 큰 걸림돌이었던 ‘성능’을 개선하면서 다양한 가능성을 보여주고 있다. 게다가 후속 제품으로 계획된 Cortex-A9와 A9의 멀티코어 버전은 본격적으로 엔트리급 PC 시장을 공략할 수 있을 것으로 기대된다.


▲ ARM 기반 넷북의 근본적인 매력은 ‘제조원가 절감’에서 찾을 수 있다.
Cortex-A8은 ARMv7의 높아진 성능을 기반으로 이제 엔트리급 PC 시장에 진입할 수 있게 되었다. Cortex-A8 기반의 프리스케일 i.MX515와 512MB DDR2, 8.9인치 디스플레이를 사용하는 등, 사양면에서는 기존 인텔 아톰 기반의 넷북과도 큰 차이가 보이지 않는다. 이채로운 점은 850g 이하로 제시된 무게와 제조원가를 120달러 수준으로 묶을 수 있다는 점이다.
이는 시스템 전체가 프로세서에 집약된 SoC 덕분이다. ARM 기반 프로세서의 장점은 ‘유연한 설계’이며, 또한 제조자 입장에서의 ‘낮은 제조원가’이다. 모든 시스템을 집약한 몇 개의 칩으로 시스템 전체를 구현 가능하며, 낮은 가격을 쉽게 구현할 수 있어, 엔트리급 PC 시장에서도 독자적인 영역을 가질 수 있을 것으로 보인다.
ARM 플랫폼은 스마트폰부터 넷북까지, 다양한 모바일용 OS에서 리눅스까지 폭넓은 소프트웨어 지원을 받고 있다. 또한 기본적인 웹 환경을 이용하기 위해 모질라 파이어폭스(Mozilla Firefox)나 어도비 플래시(Adobe Flash), 자바(JAVA) 등 소프트웨어의 지원도 추가되고 있다. 특히 최근 실질적인 웹 표준으로 자리잡고 있는 플래시는 10버전이 ARM 용으로 2009년 안에 출시될 것으로 보인다.


▲ ARM 칩의 주요 특징인 배터리 라이프도 여전한 저력을 보여준다.


▲ 기본적인 활용 성능에서는 이제 x86과 ‘동급’
ARM 아키텍처는 태생이 ‘저전력’이었다. 그 장점은 Cortex-A8에서도 그대로 적용되어 있으며, 배터리를 사용하는 모바일 영역에서 높은 경쟁력을 보여 준다. 비슷한 레벨에 있는 인텔의 아톰과 비교했을 때, 같은 조건에서 웹서핑 정도의 작업 환경은 약 3배, 비디오 재생에서는 3배 이상의 구동 시간 차이를 보여 준다.
물론 이 결과는 시스템 전체의 소비 전력을 감안한 결과이다. 만약, 프로세서 하나만으로 비교한다면 이 결과치는 더욱 커지는데, 평균 소비 전력 비교에서 아톰 800MHz와 Cortex-A8 800MHz의 소비 전력 차이는 약 18배까지 벌어진다는 결과도 제시되었다. 만약 열악한 배터리 환경을 가지는 ‘울트라 포터블’ 기기에서라면 앞에서 제시된 차이보다 더 큰 차이가 벌어질 것을 쉽게 짐작할 수 있다.
성능 면에서도 크게 뒤지지 않는다. 웹 서핑 정도의 단순 작업에서의 결과는 이런 점을 잘 보여준다. 웹페이지 로딩 시간 테스트를 보면, 128KB L2를 장착한 ARM11의 성능은 800MHz의 아톰 프로세서와 비슷한 결과를 보여주고 있다. ARM11과 Cortex-A8의 성능 차이를 감안할 경우, Cortex-A8의 결과는 아톰 1.6GHz와 비교해 거의 손색이 없다.
또한, 200개 이상의 업체가 현재 ARM 기반 프로세서와 SoC 솔루션들을 만들고 있으며, 솔루션의 선택 범위도 대단히 다양하다. 대부분의 시스템 구성 요소가 하나의 칩에 집적화되어 있어 저렴한 가격과 저전력, 소형화와 디자인의 유연성을 모두 갖추고 있다. 이런 점은 경쟁 제품이 가지지 못한 ARM 기반 프로세서들의 특징이다.

이름아이콘 들풀
2009-06-30 17:43
좋은 내용 잘 보겠습니다.~
   
이름아이콘 Marzio
2009-07-01 08:42
문제는 소비전력이죠. 본문에서도 결국은 성능은 이전의 ARM11과 비교되고 있지만 소비전력 측면은 ATOM과 비교하고 있습니다.

90nm 공정의 ARM11보다 65nm 공정의 Coretex A8의 소비전력이 많이 높다는 점이 문제인데 MP3 Play mode에서 clock을 10MHz 수준으로 돌렸다 하더라도 같은 65nm의 ARM926이나 ARM1176에서 24MHz수준으로 돌린 것에 비해 높습니다.

가장 큰 문제는 이같이 아주 낮은 클럭으로 돌아가는 애플리케이션이 아니라 비교적 높은 클럭 (400~600MHz 또는 그 이상)에서 소비전력과 발열은 기존대비 많이 증가합니다.

실제로 ARM 홈페이지의 자료를 근거로 따져봐도 높은 클럭에서의 소비전력은 우려되는 수준이 나옵니다. 해서 under 4" 디스플레이의 제품에서 슬림제품 만들기가 불가능한 수준이죠.
   
이름아이콘 아키텍트
2009-07-01 10:32
네, 인텔의 아톰 프로세서나 그 이후 프로세서보다 소비 전력에서 승부를 내지 못하면 게임 끝이죠. Windows 7의 등장으로 더욱 인텔 프로세서가 힘을 받을 거 같네요.
인베인 좋은 글의 포스팅과 함께 의논글 정말 감사합니다. 제 생각에는 지금의 시대가 시대이니만큼 ARM Cortex-A9 VS. Intel ATOM (N270) 의 비교가 공평하지 않을까합니다. Cortex-A8 VS. ATOM을 비교하면 ARM사가 약간은 억울해 하지 싶습니다. 즉 멀티코어끼리 비교를 해서 비평하는것이...^^ 7/1 20:09
   
이름아이콘 유뷰코난
2009-07-02 11:34
ARM 계열 CPU의 소비전력은 단순하게 비교하기가 쉽지 않습니다.
다양한 application에 대응하기 위해 다양한 HW 를 내장하고 있기 때문이죠.
실제 양산되는 제품을 보면 90nm의 ARM11보다는 65nm의 Cortex A8의 Power가 절대 높지 않습니다. 오히려 좋다고도 말하고 있습니다.
MP3의 경우 Architecture에서 다른 방식으로 접근이 가능합니다.
ARM Core를 최저 클럭으로 돌려도 성능이 남기때문에 요즘은 빨리 decoding을 끝낸 후 data를 메모리에 올려버리고 CPU를 꺼버리는 기술을 사용합니다.
이경우 Core와 관계없이 power가 절반수준으로 감소하게 됩니다.

45nm Cortex A8의 경우 1GHz에서의 발열이 90nm 500MHz보다도 낮은 수준입니다.
인베인 유뷰코난님 좋은 사례 개인적으로 감사합니다. 데이타를 메모리에 올리고 cpu Off하여 파워소비 절감하는 제품사례좀 혹시 없을까요? 7/3 22:18
   
이름아이콘 슈팅스타
2009-07-03 14:50
유뷰코난님처럼 Cortex-A8은 상당히 좋은 core입니다. 기존보다 같은 clock으로 높은 MIPS가 나오는 상황인데 기존보다 유리하면 유리하지 불리하진 않습니다. 그리고 Over/max clock의 경우는 일부 구간이지 full로 항상 돌리는 것은 아닙니다.
ATOM같은 CISC계열은 ARM과 같은 RISC계열보다 빠른 반면에 발열/소비전력에서는 상대가 안됩니다. 고로 ARM에서 소비전력을 우려한다는 것은 ATOM은 아예 쓰지 못할 CPU입니다.
NetBoock은 Fan이 필요하지만, SmartBook은 Fan이 없습니다. Fan 없는 PC를 보시면 아마 놀라실 겁니다. 이미 유투브에 실기영상이 있습니다.
인베인 개인적으로 발열 소비 전력 관련해서는 슈팅스타님의 의견에 저는 Absolutely Agree입니다. ^^ 7/3 22:20
   
이름아이콘 챨리권
2009-07-10 14:42
아는 교수님 말씀으로는 cortex가 자동차라면, 휘발유 냄새만 맡고 달렸을 것이라고...
   
 
덧글 쓰기 0
3500
※ 회원등급 레벨 0 이상 읽기가 가능한 게시판입니다.