상위 10 개 기사

체르노빌 재해
한국 전쟁
중국 숫자
폐 계면활성제
피츠버그 공립학교
영국의 강의 명부
멕시코
히브리어 성경
슬로베니아 문학
중국

News:

자료 압축

에서 컴퓨터 과학 그리고 정보 이론, 자료 압축 또는 근원 코딩 정보를 암호로 고쳐 쓰기의 과정은 보다 소수의를 사용하여 이다 조금 (또는 다른 정보 방위 단위 보다는) unencoded 대표는 특성의 사용을 통해 사용할 것입니다 암호화 계획. 많은 컴퓨터 사용자가 친밀한 압축의 1개의 대중적인 경우는 이다 ZIP 파일 체재, 압축 제공 뿐만 아니라로 작동하는 archiver, 많은 원시 파일 단 하나 목적지 출력 파일에 있는 저장.

어떤 커뮤니케이션에 것과 같이, 압축 자료 통신 일만 경우의 두 다 발송인 그리고의 수신기 정보 암호화 계획을 이해하십시오. 예를 들면, 이 원본은 영어를 대표하는 특성으로 해석되기 위하여 예정된ㄴ다는 것을 단지 수신기가 이해해야만 이해된다. 유사하게, 압축 자료는 해독 방법이 수신기에 의해서만 알려지는 경우에 이해될 수 있다.

압축은 비싼 자원의 소비를 감소시키기 것을 돕기 때문에 유용하다와 같은 하드 디스크 공간 또는 전송 대역폭 (계산). 아래쪽에, 압축 자료는 사용되기 위하여 감압되어야 하고, 이 여분의 것 가공은 몇몇 신청에 유해할지도 모른다. 예를 들면, 영상을 위한 압축 계획은 영상을 위해 충분히 빨리 감압되고 있다 비싼 기계설비를 그것으로 전망되기 위하여 감압될 것을 요구할지도 모른다 (영상 감압의 선택권은 안으로 충분히 그것을 보기 전에 부자유할지도 모르고다, 감압한 영상을 위해 저장 공간을 요구한다). 자료 압축 계획의 디자인은 그러므로 a를 사용한다면 경우에 압축의 정도를 포함하여 각종 요인 중 교환, 소개된 찡그림 양을 포함한다 ( 손실 압축 계획), 그리고 압축할 것을 요구되는 컴퓨터 자원 그리고 uncompress 자료.

목차

Lossless 대 손실 압축

Lossless 압축 산법은 보통 통계적인 과실 없이 발송인의 자료를 더 간결하게 대표하기 위하여 중복을 이용한다. 비손실 압축은 대부분의 실사회 자료가 있기 때문에 가능하다 통계적인 중복. 예를 들면, 영국 원본에서, 편지 "e"는 일반 편지 "z" 보다는 훨씬 더이고, 편지 "q"가 편지 "z"에 선행될 확율은 아주 작다.

불리는 압축의 다른 종류 lossy 자료 압축 또는 지각 코딩, 가능한 경우에 약간 손실은의 절조 수락가능하다. 일반적으로, lossy 자료 압축은 연구에 의해 사람들이 문제의 자료를 어떻게에 대한 감지하는지 인도될 것이다. 예를 들면, 육안은 미묘한 변이에 안으로 더 과민하다 발광성 그것 보다는 색깔에 있는 변이에 이다. JPEG 화상 압축은 부분적으로 어떤의 이 보다 적게 중요한 정보 "떨어져" 돌기 덕분에 작동한다. Lossy 자료 압축은 압축 주어진 양을 위한 제일 절조를 얻는 방법을 제공한다. 어떠한 경우에는, 투명한 (눈에 띄지 않는) 압축은 원한다; 다른 경우에, 절조는 자료 양을 가능한한 많이 감소시키기 위하여 희생된다.

비손실 압축 계획은 더 높은 압축을 달성하는 위하여 lossy 계획은 자료의 약간 손실을 받아들이는 그러나 원래 자료가 개축될 수 있다 그래야 뒤집을 수 있다.

그러나, lossless 자료 압축 산법은 항상 몇몇 파일을 압축하지 못할 것이다; 참으로, 어떤 압축 산법든지 필요하게 식별할 수 있는 본을 포함하는 아무 자료나 압축하지 못하지 않을 것이다. 이미 압축된 자료를 압축하는 시도는 확장 그러므로 보통 압축하는 시도 것과 같이, 귀착될 것이다 암호로 고쳐 쓰는 자료.

실제로는, lossy 자료 압축은 또한 다시 압축이 작동하지 않는 점에 예를 들면 항상 파일의 마지막 바이트를 제거하는, 극단적으로 lossy 산법이 빈 점까지 항상 파일을 압축하더라도, 올 것이다.

lossless의 보기 대 손실 압축은 뒤에 오는 끈이다:

25.888888888

이 끈은 다음과 같음 압축될 수 있다:

25.[9]8

해석해 것과 같이, "25개 9개의 eights"를, 원래 끈 완전하게 휴양한다, 더 작은 모양에 다만 써 가르킨다. lossy 체계에서는, 를 사용하는

26

대신, 원래 자료는 더 작은 파일 사이즈의 이득에, 분실된다.

신청

위는 아주 간단한 예의이다 달리 길이 암호화, 연속적인 동일한 자료값의 큰 뛰기가 뛰기의 자료값 그리고 길이로 간단한 부호 대체되는지 그 안에서. 이것은 lossless 자료 압축의 보기이다. 그것은 자주 사용한다 연결 사무용 컴퓨터에 디스크 공간, 또는 더 나은 사용을 낙관하기 위하여 대역폭 a에서 컴퓨터 통신망. 스프레트시트와 같은 기호 자료를 위해 원본, 실행 가능 프로그램, 단일-비트 조차 바꾸기 것이 관대히 다루어지기 수 없기 때문에 등등 의 losslessness는 근본적이다 (몇몇 한정된 케이스에서를 제외하고).

시각 및 오디오 자료를 위해, 질의 약간 손실은 자료의 본질을 잃기 없이 관대히 다루어질 수 있다. 인간 감각 체계의 제한을 이용해서, 많은 공간은 고유에서 거의 구별할 수 없는 산출을 일으키고 있는 동안 저장될 수 있다. 이 lossy 자료 압축 방법은 전형적으로 압축 속도, 압축 자료 크기 및 질 손실 사이 3방향 교환을 제안한다.

Lossy 화상 압축 안으로 사용된다 디지탈 카메라, 화질의 최소 강직을 가진 저장력을 증가하기 위하여. 유사하게, DVDs lossy를 이용하십시오 MPEG-2 코덱 를 위해 영상 압축.

lossy에서 오디오 압축, 방법의 psychoacoustics 의 비 청취가능하거나 (보다 적게 청취가능한) 분대를 제거하는 사용된다 신호. 인간 연설의 압축은 훨씬 전문화된 기술로 수시로 "그래야, 실행된다연설 압축"또는 "음성 코딩은" 때때로 "오디오 압축" 보다는 분리되는 분야 구별된다. 다른 오디오와 연설 압축 기준은 밑에 열거되다 오디오 코덱. 음성 압축은 안으로 사용된다 인터넷 통화법 예를 들면, 오디오 압축은 찢는 CD를 위해 사용되고는 오디오 선수에 의해 해독되는 그러나.

이론

압축의 이론적인 배경은 곁에 제공된다 정보 이론 (가깝게 인과 관련되었다 연산 정보 이론)와 곁에 비율 찡그림 이론. 이 학과목은 근본적으로 곁에 창조되었다 Claude Shannon, 1940 년대와 1950년대 초 후반에 화제에 기본적인 종이를 간행한. 암호법 그리고 코딩 이론 또한 밀접한 관계가 있. 자료 압축의 아이디어는 통계학적 결론과 깊게 연결된다.

많은 lossless 자료 압축 체계는 four-stage 모형의 점에서 전망될 수 있다. Lossy 자료 압축 체계는 전형적으로 훨씬 단계, 를 포함하여, 예를 들면, 예측, 주파수 전이 및 양자화를 포함한다.

Lempel-Ziv (LZ) 압축 방법은 lossless 저장을 위한 대중적인 산법 중 이다. 공기를 빼십시오 압축이 느릴 수 있더라도, 감압 속도와 압축 비율을 위해 낙관되는 LZ에 변이는 이다. 안으로 사용된다 공기를 빼십시오 피케이집, gzip 그리고 PNG. LZW (Lempel Ziv 웰치) GIF 심상에서 사용된다. 또한 주목할 만하다 Zip 방법의 기초로 봉사하는 LZR (LZ-Renau) 방법은. LZ 방법은 테이블 입장이 자료의 반복된 일련을 대용되는 테이블 근거한 압축 모형을 이용한다. 대부분의 LZ 방법을 위해, 이 테이블은 입력에 있는 더 이른 자료에서 역동적으로 생성된다. 테이블 자체는 수시로 이다 Huffman는 암호로 고쳐 썼다 (예를들면. SHRI, LZX). 잘 실행하는 현재 LZ 근거한 코딩 구성은 이다 LZX, 마이크로소프트에서 사용해 택시 체재.

제일 압축기는 그의 예측이 불린 산법에 결합되는 개연론 모형을 이용한다 산수 코딩. 곁에 발명되는 산수 코딩 Jorma Rissanen, Neal Witten에 의해 실제적인 방법으로 돌아 및 Cleary는 Huffman 더 잘 알려지는 산법에, 우량한 압축을 달성하고, 예측이 강하게 문맥 의존할 적합한 자료 압축 업무에 특히 잘 빌려주고. 산수 코딩은 2층 심상 압축 기준에서 사용된다 JBIG및 문서 압축 기준 DjVu. 원본 입장 체계, Dasher, 반대 산수 코더는 이다.

기계 배우고는 그리고 압축 사이 가까운 연결이 있다: 그것의 전체 역사가 주어진 순서의 뒤 확율을 예언하는 체계는 최선 자료 압축을 위해 최선 압축기는 예측을 위해 사용되는 수 있는 그러나, (산출 배급에 산수 코딩을 를 사용하는) 이용될 수 있다 (잘 압축하는 이전 역사가 주어지는 상징을 찾아내서). 이 등가는 "일반적인 정보"를 위해 기준으로 자료 압축을 위해 정당화로 사용되었다 [1].

또한 보십시오

자료 압축 화제

압축 산법

Lossless 자료 압축

Lossy 자료 압축

보기 실시

  • 공기를 빼십시오 (곁에 사용되는 LZ77와 Huffman 코딩의 조합) - ZIP, gzip 그리고 PNG 파일
  • LZMA 곁에 사용하는 7 지퍼로 잠그십시오 그리고, 조금 적게, StuffitX
  • LZO (동쪽으로 향하게 하는 아주 빠른 LZ 변이, 속도)
  • LZX (LZ77 가족 압축 산법)
  • 유닉스 압착기 공용품 (. Z 파일 형식), GIF 사용 LZW
  • 유닉스 사용되는 공용품 (.z 파일 형식) Huffman 코딩
  • bzip2 (굴을 파 짐수레꾼의 조합은 변형시키고 Huffman 코딩)
  • PAQ (위에 근거하는 아주 높은 압축 문맥 섞기, 그러나 극단적으로 감속하십시오; 가장 높은 압축 경쟁의 정상에서 경쟁)
  • JPEG (분리된 여현을 사용하여 화상 압축은 의 그 후에 양자화, 그 후에 Huffman 코딩 변형시킨다)
  • MPEG (넓은 사용중에 있는 오디오와 영상 압축 기준 가족, 를 사용하는 DCT 그리고 영상을 위한 동의 보상된 예측)
    • MP3 (의 부분 MPEG-1 subbanding를 사용하는 소리와 음악 압축을 위한 기준, MDCT, Huffman 지각 만들고, 양자화 그리고 코딩)
    • AAC (의 부분 MPEG-2 그리고 MPEG-4 오디오 코딩 명세, 를 사용하는 MDCT, Huffman 지각 만들고, 양자화 그리고 코딩)
  • Vorbis (특허 방해 피에 초점으로 디자인되는 DCT에 근거하는 AAC 유사하 오디오 코덱)
  • JPEG 2000년 (작은파도, 그 후에 양자화, 그 후에 엔트로피 코딩을 사용하는 화상 압축)
  • TTA (용도 선형 예언하는 코딩 lossless 오디오 압축을 위해)
  • FLAC (선형 예언하는 코딩 lossless 오디오 압축을 위해)

신체

압축 산법 비교를 위해 상용되는 정보 수집.

참고

외부 연결


The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence