'멀티미디어/이미지 프로세싱'에 해당되는 글 10건


YCbCr과 YPbPr

 

색상신호를 RGB Color Space 상의 R, G, B의 색상 요소로 분해할 수 있는데, 우리는 눈에 보이는 대로 인식되는 이른바 "빛의 삼원색"에 너무나 익숙하다. 그런데, YCbCr이나 YPbPr은 색상신호가 아니라 휘도(Luminance) Y와 색차신호 Cb(Pb), Cr(Pr)에 기반한 색 표현 방식이다. 인간의 눈이 색상보
다 밝기에 더 민감하기 때문에 색차신호를 이용해서 처리하는 것이 효과적이다.

신호 표준들을 보면 Pb, Pr은 아날로그 색차신호를 호칭할 때 사용하는 용어이고 Cb, Cr은 디지털 신호로 부호화했을 때 사용하는 용어이다. 그런데 이를 혼용해서 부르는 경우가 많아졌다.

Cb/Cr과 Pb/Pr의 차이는 NTSC(480i)레벨의 신호단자를 [Y/Cb/Cr]로 표시하고, NTSC(480i)레벨 이상의 영상포맷(HDTV 720p,1080i)을 사용할 수 있는 단자를[Y/Pb/Pr]로 표시한다.

 현재 HDTV에서 사용하는 SMPTE-274M 표준의 YPbPr 신호의 수식은 다음과 같다.

Y = 0.2126*R + 0.7152*G + 0.0722*B

Pb = [0.5 / (1-0.0722)] * (B-Y)

Pr = [0.5 / (1-0.2126)] * (R-Y)

Y, Cr, Cb
CCIR 601 Coding System의 디지털 휘도신호와 색차신호이다. 휘도신호 Y는 13.5MHz으로 표본화되며, 2개의 색차신호는 휘도샘플 한 개를 공유하여 6.75MHz으로 표본화된다. Cr은 R-Y, Cb는 B-Y의 디지털화된 신호이다.

 다음은 RGB와 YCbCr 관계를 공식으로 표현한 것이다.

Y = 0.299*R + 0.587*G + 0.114*B
Cb = -0.16874*R - 0.33126*G + 0.5*B
Cr = 0.5*R - 0.41869*G - 0.08131*B

4:2:2
콤포넌트 비디오의 휘도(Y)와 색차신호(R-Y, B-Y)를 디지털화하는데 사용되는 표본화 주파수의 비율. 4:2:2라는 용어는 Y가 4번 표본화될 때 R-Y와 B-Y는 2번 표본화되는 것을 의미하는데, 이는 4:1:1에 비하여 휘도에 대한 색도대역 폭을 더 많이 할당한 것이다. CCIR 601에서 4:2:2 표본화는 디지털 스튜디오 장비의 표준으로서, 4:2:2와 CCIR 601이라는 두 용어가 일반적으로 동의어로 사용되지만 기술적으로 정확히 같은 의미는 아니다. Y의 표본화 주파수는 13.5MHz 이고, R-Y와 B-Y는 각각 6.75MHz로서 고품질 크로마키에 적합한 3.37MHz의 최대 가능 색대역폭을 제공한다.

 Composite 전송

3개의 영상신호를 합성하여 노란색인 하나의 선에 전송한다. 색을 분리하지 않고 합성하여 하나의 선으로 전송하기 때문에 화질이 가장 나쁘다. 흰색은 왼쪽 오디오, 빨간색은 오른쪽 오디오.

 S-Video (Super Video, Separate Video) 전송

3개의 영상신호를 밝기신호(Y)와 색차신호인 Cb, Cr(Pb, Pr)을 하나의 색신호(C)로 합성(Synthesized)하여 2개의 선으로 전송. Component 전송에 비해 화질이 좋으나 Component 전송보다 나쁘다.

전문가들은 S-Video가 아닌 Y/C(Brightness: 밝기신호 & Color:색신호) Video라 일컫는데, 이것이 비디오 신호 포멧을 좀 더 잘 표현하고 있기 때문이다.

 Component 전송

영상신호를 휘도(Y), 색차(Cb, Cr)의 세가지 성분(Component)으로 각각 분리하여 이를 3개의 선으로 보낸다. 화질이 가장 좋다.


'멀티미디어 > 이미지 프로세싱' 카테고리의 다른 글

YUV420을 RGB로 변환하기  (0) 2009.03.18
YUV420(YV12)  (0) 2009.03.18
동영상 파일끼리 PSNR 비교하는 프로그램  (0) 2009.03.18
DCT 프로그램  (0) 2009.03.18
H.264 tutoroals  (0) 2009.03.18
블로그 이미지

맨오브파워

한계를 뛰어 넘어서..........

,
// RGB 값을 얻기위한 YUV 테이블을 만든다.
// YUV_B, YUV_R, YUV_G 배열은 사용하기 전에 YUV_lookup_table() 함수로 초기화해야 한다.

double YY[256], BU[256], GV[256], GU[256], RV[256];
unsigned char YUV_B[256][256];
unsigned char YUV_R[256][256];
unsigned char YUV_G[256][256][256];

void YUV_lookup_table()
{
    int i, j, k;
    double i_value;
    for( i=255; i>=0; i-- )
    {
        YY[i] = (1.164*(i-16.0));
        BU[i] = (2.018*(i-128.0));
        GV[i] = (0.831*(i-128.0));
        GU[i] = (0.391*(i-128.0));
        RV[i] = (1.596*(i-128.0));
    }

    for( i=255; i>=0; i-- ){
        for( j=255; j>=0; j-- )
        {
            i_value = YY[i] + BU[j];
            if ( i_value > 255 ) i_value=255;
            else if ( i_value < 0 ) i_value=0;
            YUV_B[i][j]=(int)i_value;

            i_value = YY[i] + RV[j];
            if ( i_value > 255 ) i_value=255;
            else if ( i_value < 0 ) i_value=0;
            YUV_R[i][j]=(int)i_value;
            for( k=0; k<256; k++ )
            {
                i_value = YY[i] - (GU[j] + GV[k]);
                if ( i_value > 255 ) i_value=255;
                else if ( i_value < 0 ) i_value=0;
                YUV_G[i][j][k] =(int)i_value;
            }
        }
    }
}

// YUV 영상을 RGB 영상으로 바꾸는 함수
void yuv420_to_rgb( unsigned char *in, unsigned char *out, int w, int h )
{
    int x,y;
    double imgsize = w*h;
    int w3 = w*3;
    double uvsize = imgsize/4.0;

    unsigned char *pY = in;
    unsigned char *pV = in + (int)imgsize;
    unsigned char *pU = in + (int)imgsize + (int)uvsize;

    int y00, y01, y10, y11;
    int u,v;    
    unsigned char *p;

   // 윈도우에서는 영상의 상하가 거꾸로 저장되지 때문에 아래와 같이 코드 작성.
    for( y=0; y<=h-2; y+=2 )
    {
        for( x=0; x<=w-2; x+=2 )
        {
            p = out + w3*(h-y-1) + x*3;
            u = *pU;
            v = *pV;

            y00 = *pY;
            y01 = *(pY+1);
            y10 = *(pY+w);
            y11 = *(pY+w+1);

            *(p)        = YUV_B[y00][u];
            *(p+1)      = YUV_G[y00][u][v];
            *(p+2)      = YUV_R[y00][v];

            *(p+3)      = YUV_B[y01][u];
            *(p+3+1)    = YUV_G[y01][u][v];
            *(p+3+2)    = YUV_R[y01][v];

            *(p-w3)     = YUV_B[y10][u];
            *(p-w3+1)   = YUV_G[y10][u][v];
            *(p-w3+2)   = YUV_R[y10][v];

            *(p-w3+3)   = YUV_B[y11][u];
            *(p-w3+3+1) = YUV_G[y11][u][v];
            *(p-w3+3+2) = YUV_R[y11][v];
            
            pU++;
            pV++;
            pY = pY + 2;
        }
        pY = pY + w;
    }

    // 일반적인 경우 아래의 코드 사용함.
    /*for( y=0; y<=h-2; y+=2 )
    {
        for( x=0; x<=w-2; x+=2 )
        {
            p = out + w3*y + x*3;
            u = *pU;
            v = *pV;

            y00 = *pY;
            y01 = *(pY+1);
            y10 = *(pY+w);
            y11 = *(pY+w+1);

            *(p)        = YUV_B[y00][u];
            *(p+1)      = YUV_G[y00][u][v];
            *(p+2)      = YUV_R[y00][v];

            *(p+3)      = YUV_B[y01][u];
            *(p+3+1)    = YUV_G[y01][u][v];
            *(p+3+2)    = YUV_R[y01][v];

            *(p+w3)     = YUV_B[y10][u];
            *(p+w3+1)   = YUV_G[y10][u][v];
            *(p+w3+2)   = YUV_R[y10][v];

            *(p+w3+3)   = YUV_B[y11][u];
            *(p+w3+3+1) = YUV_G[y11][u][v];
            *(p+w3+3+2) = YUV_R[y11][v];
            
            pU++;
            pV++;
            pY = pY + 2;
        }
        pY = pY + w;
    }*/
}


//////////////////////////////////////////////////////////////////////////////////////
// BMP 파일로 저장하기

        int rgbSize = _imageSize.cx*_imageSize.cy*3;
        BYTE* pRgb = new BYTE[rgbSize];
        memset(pRgb, 0, rgbSize);

        yuv420_to_rgb(_pImage, pRgb, _imageSize.cx, _imageSize.cy);

        /*TCHAR curDirPath[512];
        ::GetModuleFileName(NULL, curDirPath, 512);
        TCHAR* pExt = _tcsrchr(curDirPath, _T('\\'));
        if(pExt) *pExt = 0;*/

        TCHAR defExt[] = _T("bmp");
        TCHAR filters[] = _T("bmp Files(*.bmp)|*.bmp|All Files(*.*)|*.*||");
        DWORD flags = OFN_HIDEREADONLY | OFN_OVERWRITEPROMPT;
        TCHAR cd[_MAX_PATH];
        GetCurrentDirectory(_MAX_PATH, cd);

        CFileDialog dlg(FALSE, defExt, 0, flags, filters, this);
        dlg.m_ofn.lpstrInitialDir = cd;        
        if(IDOK == dlg.DoModal()){
            HANDLE hFile;
            hFile = CreateFile(dlg.GetPathName(), GENERIC_WRITE, 0, NULL, CREATE_ALWAYS, FILE_ATTRIBUTE_NORMAL, NULL);
            if (hFile == INVALID_HANDLE_VALUE){ 
                CString s; s.Format(_T("Could not create file : %s (error %d)\n"), dlg.GetPathName(), GetLastError());
                AfxMessageBox(s, MB_ICONSTOP|MB_OK);
                return;
            }

            int headerSize = sizeof(BITMAPFILEHEADER) + sizeof(BITMAPINFOHEADER) + sizeof(RGBQUAD);
            BITMAPFILEHEADER fileHeader = { ((WORD)('M'<<8)|'B'), headerSize + rgbSize, 0, 0,  headerSize};
            BITMAPINFOHEADER infoHeader = { sizeof(BITMAPINFOHEADER), _imageSize.cx, _imageSize.cy, 1, 24, BI_RGB, rgbSize, 0, 0, 0, 0 };
            RGBQUAD rgbQuad = { 0, };

            DWORD writtenLen = 0;
            if(FALSE == WriteFile(hFile, &fileHeader, sizeof(fileHeader), &writtenLen, 0)){
                CString s; s.Format(_T("Could not write file : %s (error %d)\n"), _T("File Header"), GetLastError());
                AfxMessageBox(s, MB_ICONSTOP|MB_OK);
            }

            if(FALSE == WriteFile(hFile, &infoHeader, sizeof(infoHeader), &writtenLen, 0)){
                CString s; s.Format(_T("Could not write file : %s (error %d)\n"), _T("Info Header"), GetLastError());
                AfxMessageBox(s, MB_ICONSTOP|MB_OK);
            }

            if(FALSE == WriteFile(hFile, &rgbQuad, sizeof(rgbQuad), &writtenLen, 0)){
                CString s; s.Format(_T("Could not write file : %s (error %d)\n"), _T("RGB Quad"), GetLastError());
                AfxMessageBox(s, MB_ICONSTOP|MB_OK);
            }
            
            if(FALSE == WriteFile(hFile, pRgb, rgbSize, &writtenLen, 0)){
                CString s; s.Format(_T("Could not write file : %s (error %d)\n"), dlg.GetPathName(), GetLastError());
                AfxMessageBox(s, MB_ICONSTOP|MB_OK);
            }
            CloseHandle(hFile);
        }        
        
        if(pRgb)    delete [] pRgb;

'멀티미디어 > 이미지 프로세싱' 카테고리의 다른 글

YCbCr과 YPbPr  (0) 2009.03.18
YUV420(YV12)  (0) 2009.03.18
동영상 파일끼리 PSNR 비교하는 프로그램  (0) 2009.03.18
DCT 프로그램  (0) 2009.03.18
H.264 tutoroals  (0) 2009.03.18
블로그 이미지

맨오브파워

한계를 뛰어 넘어서..........

,

참조 사이트: http://www.fourcc.org 

YUV에도 여러 가지 종류가 있다. 그 중에서 YUV420(YV12)에 대해서 알아보도록 하겠다.

YUV420(YV12)

This is the format of choice for many software MPEG codecs. It comprises an NxM Y plane followed by (N/2)x(M/2) V and U planes.

  Horizontal Vertical
Y Sample Period 1 1
V Sample Period 2 2
U Sample Period 2 2

 

 Positive biHeight implies top-down image (top line first)

ATI says they have a download which contains this codec but I can't find it on their site. If you would like something similar for Quicktime, try here.

=======================================================================================

// 아래 코드는 YUV 바이트 스트림 배열에서의 YUV 각 값의 위치를 찾기위한 코드가 설명되어 있다.

Height = 16;
Width  = 16;
Y'ArraySize = Height × Width;    // (256)
Y' = Array[7 × Width + 5];
U = Array[(7/2) × (Width/2) + 5/2 + Y'ArraySize];
V = Array[(7/2) × (Width/2) + 5/2 + Y'ArraySize + Y'ArraySize/4];

RGB = Y'UV444toRGB888(Y', U, V);

 

위 예제 그림은 Y -> U -> V 순으로 바이트 스트림이 되어 있지만 항상 정해진 것은 아니다.

다른 바이트 스트림의 경우 Y -> V -> U 순으로 되어 있는 경우도 있다.

  

YUV420 <------> RGB 변환

참고 사이트 : http://www.fourcc.org/fccyvrgb.php

 The following 2 sets of formulae are taken from information from Keith Jack's excellent book "Video Demystified" (ISBN 1-878707-09-4).

RGB to YUV Conversion

Y  =      (0.257 * R) + (0.504 * G) + (0.098 * B) + 16

Cr = V =  (0.439 * R) - (0.368 * G) - (0.071 * B) + 128

Cb = U = -(0.148 * R) - (0.291 * G) + (0.439 * B) + 128

YUV to RGB Conversion

B = 1.164(Y - 16)                   + 2.018(U - 128)

G = 1.164(Y - 16) - 0.813(V - 128) - 0.391(U - 128)

R = 1.164(Y - 16) + 1.596(V - 128)

#define clip(var) ((var>=255)?255:(var<=0)?0:var)

변환을 하면서 위와 같이 각 값에 대하여 clip이 필요하다.

'멀티미디어 > 이미지 프로세싱' 카테고리의 다른 글

YCbCr과 YPbPr  (0) 2009.03.18
YUV420을 RGB로 변환하기  (0) 2009.03.18
동영상 파일끼리 PSNR 비교하는 프로그램  (0) 2009.03.18
DCT 프로그램  (0) 2009.03.18
H.264 tutoroals  (0) 2009.03.18
블로그 이미지

맨오브파워

한계를 뛰어 넘어서..........

,

2,3개의 동영상 파일의 PSNR을 비교하는 프로그램입니다. 

프레임별로도 확인가능하다. 심플하면서 괜찮은것 같다..


'멀티미디어 > 이미지 프로세싱' 카테고리의 다른 글

YUV420을 RGB로 변환하기  (0) 2009.03.18
YUV420(YV12)  (0) 2009.03.18
DCT 프로그램  (0) 2009.03.18
H.264 tutoroals  (0) 2009.03.18
YUV 420 포멧 viewer 및 소스 파일  (0) 2009.03.18
블로그 이미지

맨오브파워

한계를 뛰어 넘어서..........

,

동영상 압축에서의 Integer transform(DCT)에 대한 C 소스입니다.

Fast DCT입니다.


블로그 이미지

맨오브파워

한계를 뛰어 넘어서..........

,

1. Avc Picturemanagement Draft 1

2. Overview

3. Loopfilter(Deblocking filter)

4. Inter prediction

5. Intra prediction

6. VLC(UVLC, CAVLC)

7. CABAC

8. Transform(DCT, Quantization)

블로그 이미지

맨오브파워

한계를 뛰어 넘어서..........

,
YUV format 4:2:0 을 볼 수 있는 viewer 와 소스파일입니다. 

'멀티미디어 > 이미지 프로세싱' 카테고리의 다른 글

DCT 프로그램  (0) 2009.03.18
H.264 tutoroals  (0) 2009.03.18
JPEG 파일을 볼 수 있는 프로그램의 소스  (0) 2009.03.18
Modeling AWGN channel  (0) 2009.03.18
영상 처리 용어 해설  (0) 2009.03.18
블로그 이미지

맨오브파워

한계를 뛰어 넘어서..........

,

Jpg 파일을 읽어서 decoding 한 후 디스플레이를 해주는 소스입니다.

JPEG decoding을 공부하는 데 도움이 될 수 있을 것도 같습니다.

 


'멀티미디어 > 이미지 프로세싱' 카테고리의 다른 글

DCT 프로그램  (0) 2009.03.18
H.264 tutoroals  (0) 2009.03.18
YUV 420 포멧 viewer 및 소스 파일  (0) 2009.03.18
Modeling AWGN channel  (0) 2009.03.18
영상 처리 용어 해설  (0) 2009.03.18
블로그 이미지

맨오브파워

한계를 뛰어 넘어서..........

,

Section 2: Modeling an Additive

White Gaussian Noise Channel

 This section models noise at the output y(t) of the channel in Section 1. h(t) in figure 1.1 is used to represent the combined effect of modulator, demodulator and channel. In this course, only discrete-input modulators are of interest. Hence, input symbols X take their values in a finite sample while the channel output value Y can take on any values along the real line. Such a model is called a Discrete-Input Continuous-Output channel and is characterized by the conditional probability density function

 Equation 2.1:

                                                  k = 0,1,……,q-1 

 relating the real output value to all possible inputs. The most representative of such a model is the Additive White Gaussian Noise Channel for which

 Equation 2.2:

                                                                

 where N is the zero mean Gaussian random variable with variance and X = for k = 0,1,….,q-1. For a given X, it follows that Y is Gaussian with mean  and variance . Using this new information, the previous conditional probability density function becomes

 Equation 2.3:

                                               

 

For every input sequence , i=1,2,…,n, there is a corresponding output sequence that can be expressed as

 Equation 2.4:

                                                         i=1,2,….,n

 

For a memoryless channel, we can express the conditional probability density function for each given input sequence as

 Equation 2.5:

                     

 

 

The typical model of such a channel is shown below in Figure 2.1.

 Figure 2.1:

'멀티미디어 > 이미지 프로세싱' 카테고리의 다른 글

DCT 프로그램  (0) 2009.03.18
H.264 tutoroals  (0) 2009.03.18
YUV 420 포멧 viewer 및 소스 파일  (0) 2009.03.18
JPEG 파일을 볼 수 있는 프로그램의 소스  (0) 2009.03.18
영상 처리 용어 해설  (0) 2009.03.18
블로그 이미지

맨오브파워

한계를 뛰어 넘어서..........

,

 
  • AAchromatic 색상이 없음. 색상이 없다는 것은 검정색에서 흰색의 범위에 해당하는 회색을 의미한다.
  • Adaptive algorithm(적응적 알고리즘) 어떤 자료를 그 자료에 대한 사전 지식없이 처리하는 알고리즘.
  • Additive color(부가적 컬러) 서로 다른 주파수 분포를 가지는 빛의 조합으로 생성되는 색상. 기본색상은 빨강, 녹색, 파랑이다. 부가 시스템은 방사성이므로 빛을 생성한다.
  • Affine Transform(어파인 변환) 회전, 전이, 크기 변화와 이들의 조합으로 이루어지는 선형 기하 변환.
  • Algorithm(알고리즘) 어떤 문제를 해결하거나 작업을 수행하기 위한 단계들의 집합.
  • Aliasing(에일리어싱) 영상의 최고 공간 주파수의 두 배 보다 적은 비율로 영상을 샘플링했을 경우 발생하는 결과. 영상의 에일리어싱은 대각선의 경계를 따라 톱니 모양의 계단 형태로 영상을 확장할 수 있다.
  • Alpha channel(알파 채널) 알파 블렌딩(alpha blending)에 사용되는 값들과 알파을 위한 저장소. 알파 블렌딩은 기존의 두 화소들을 결합하여 새로운 화소를 만들어 내는 수단을 제공한다. 알파 채널에 있는 자료들은 객체의 반 투명성을 제공한다.
  • Analog-to-Digital converter(A/D, D/A 변환기) 아날로그 전압을 디지털 전압으로 변환하는 장치.
  • Anti-aliasing(엔티 에일리어싱) 에일리어싱 현상에 의해 톱니바퀴 모양으로 변한 선의 경계를 부드럽게 해주는 기술. 이 기술에서는 인접 화소를 평균화하기 위해 건형 보간법이 주로 사용된다.
  • Area process(영역 처리) 하나의 화소를 그 화소와 인접 화소들의 값들에 따라 변경하는 영상처리.
  • Aspect ratio 영상의 가로와 세로의 크기 비율. 텔레비젼의 경우 4:3이다.
  • Barrel distortion(배럴 왜곡) 영상을 물고기 눈으로 본 것과 같이 만드는 일반적인 왜곡.
  • Basis function(기저 함수) 다른 함수를 구성하는 함수들의 집합.
  • Bilinear interpolation(양선형 보간법) 4개의 주어진 값들 사이의 새로운 값을 만들어내는 방법. 두 방향의 선형 보간법과 관련된다.
  • Bilinear transformation(양선형 변환) 목표 화소의 소스주소를 결정하기 위한 선형 보간법을 사용하는 변환.
  • Bilevel(이진 레벨) 0과 1, 검정색과 흰색 둘 중 하나의 값으로 이루어 진다.
  • Bit-mapped graphics(비트 맵 그래픽스) 화소들의 배열로 이루어지는 영상. 레스터 그래픽스(raster graphics)라고도 불린다.
  • Blurring(블러링) 영상에서 상세한 부분을 제거하는 과정. 화소의 정보들이 입접 화소들에 스며드는 경향이 있다. 이 효과는 카메라에서 초점이 맞지 않을 때 나타난다.
  • Brightness(밝기) 광원이 발산하는 빛의 정도를 나타내는 시각, 지각의 요소.
  • CAT(Computer-aided tomography) 컴퓨터 지원 단층 촬영.
  • CCD(Charg coupled device) CCD는 영상을 획득하기 위해 사용되는 빛의 센서이다. 대부분의 캠코더들이 CCD의 기반이다.
  • CCIR 국제 라디오 자문 회의.
  • CCIR recommandation 601-1A NTSC와 PAL을 모두 지원하기 위해 정의된 컬러 비디오 표준.
  • CCITT 표준을 설정한는 국제 표준의 약자. 본 명칭은 International Telephone and Telegraph Consultative Committee이다.
  • CT 컴퓨터 단층 촬영. X-선을 이용한 영상 획득 시스템. 전형적으로 골격 영상을 얻기위해 사용된다.
  • Checksum(체크섬) 오류 검출을 위해 사용되는 자료. 한 영상의 모든 바이트들이 오버플로우를 무시하면서 더해진다. 그 결과 바이트가 체크섬이다. 영상의 전송시에 체크섬이 영상자료와 함께 전송된다. 만약 체크섬이 영상을 받은 컴퓨터에서 계산한 값과 다르면, 전송 오류가 발생한 것이다. 체크섬은 때때로 영상의 헤더 부분에 저장되기도 한다.
  • Chrominance(색상) 하나의 색상과 같은 밝기값을 가지는 기준의 흰색사이의 차이.
  • CMY Cyan, Magenta, Yellow의 기본 값들로 구성된 차분 색상 공간. 이것은 RGB 컬러 공간의 반대이다.
  • CMYK 출력 산업에서 기본적으로 사용되는 차분 컬러 공간. CYMK는 Cyan, Magenta, Yellow, blacK을 대표한다. 대부분의 출력 장치들은 부가색상 공간을 사용한다. CYMK는 Cyan, Magenta, Yellow, blacK 색소를 적용함으로써 흰색 표면으로부터 색상을 제거해 만들어진다는 의미에서 차분이다.
  • Codebook(코드북) 각각이 그에 해당하는 색인을 가진 영상 패턴들의 집합. 영상 압축은 영상 전체의 패턴을 대신해서 코드북의 색인만으로 영상의 부분을 표현함으로써 이루어질 수 있다.
  • Color gamut(색상 전역) 기본 컬러들의 비율을 바꾸어 혼합함으로써 얻어질 수 있는 전체 색상의 스펙트럼.
  • Color space(색상공간) 색상의 수학적 표현. RGB는 카테션 좌표 시스템에 기반을 두며, HSI는 극 좌표 시스템에 기반을 둔다.
  • Compositing(합성과정) 여러 영상의 부분들을 결합하여 하나의 영상을 만드는 과정.
  • Compression(압축) 자료를 좀더 작은 양의 자료로 표현하는 과정. 이것은 중복되는 정보를 제거함으로써 이루어질 수 있다. 또 다른 기술은 가장 자주 사용되는 자료를 짧은 자료로 표현하는 것이다.
  • Compression ratio(압출률) 압출률은 자료가 얼마나 압축되는가 하는 정도를 말한다. 만약 2메가 바이트 영상을 100킬로 바이트로 압축하는 압축 알고리즘을 적용한다면, 압축률은 20이 된다. (2,000,000 bytes / 100,000 bytes)
  • Cone(콘) 색상과 상세한 부분을 감지할 수 있는 눈 속의 감광기관.
  • Continuous tone(연속된 색조) 일관성 있고 끊기지 않는 밝기값. 사진은 연속된 색조이다.
  • Contouring(컨투어링) 영상을 충분한 비트로 표현하지 않으므로써 만들어지는 영상 제작물. 윤곽영상은 영상에서 부드러운 전환 대신에 날카로운 데비를 가진다. 이러한 색상 영역은 지리적 윤곽 지도와 유사하게 영상을 만든다.
  • Contrast(대비) 영상에서 어두운 부분과 밝은 부분 사이의 밝기값의 변화.
  • Contrast stretching(대비 확장) 대비가 낮은 영상에서 대비를 높이는 기술.
  • Control points(제어점) 영상 왜곡에 사용되는 기준점들. 전형적으로 제어점들은 근원 영상에서의 지리적 위치와 그에 대응하는 목표 영상에서의 위치로 구성된다.
  • Convolution(회선) 영상의 스무딩(smoothing)과 샤프닝(sharpening)과 같은 효과를 위해 사용되는 영상 작업. 이 과정은 매우 간단하다. 중심화소의 인접화소들에 대한 가중화된 합이 중심화소의 위치에 할당된다. 이 가중치들은 회선 커널이나 마스크로 불리는 배열로 구성된다.
  • Convolution coefficient(회선 계수) 회선 커널이나 마스크의 개별적 가중치.
  • Convolution kernel(회선 커널) 회선 계수들의 배열, 회선 마스크라고도 불린다.
  • Convolution mask(회선 마스크) 회선 계수들의 배열, 회선 커널이라고도 불린다. 
  • Cornea 눈의 동공과 홍채를 감싸고 있는 투명한 외피막
  • Cross dissolve 화소 대 화소의 보간을 통해 한 영상을 다른 영상에 혼합시키는 기술
  • CRC(Cyclic Redundancy Check) 오류 검출 기술. 다항식 기반의 알고리즘이 한 블록의 자료에 적용되어 CRC문자를 만든다. 이 문자는 저장되어 자료와 함께 전송된다. 수신측에서는 CRC 알고리즘을 수행하여 새로운 CRC문자를 생성한다. 만약 이들이 일치하지 않으면 자료가 손상된 것이다. 이것은 때로 영상 헤더에 포함되기도 한다.
  • CRT(Cathod Ray Tube) 텔레비젼 화면과 컴퓨터 출력 장치를 위해 사용되는 커다란 진공관
  • DCT(Discreat Cosine Transform) 영상압축을 포함한 많은 응용프로그램에 사용되는 변환
  • DFT(Discreat Fourier Transform) 이산 퓨리어 변환
  • DIP(Document Image Processing) DIP 시스템은 서류들을 디지털화하여 획득, 저장, 출력할 수 있는 종이 없는 환경에 사용된다.
  • Decoder(해석기) 암호화된 자료를 원래의 자료 또는 합당한 표현으로 해석 해주는 시스템의 일부
  • Densitometer(사진 농도계) 필름을 통해 전송되는 빛의 양을 측정하는 장치
  • Difference image(차영상) 하나의 영상을 화소 단위로 다른 영상에서 뺀 결과 영상
  • Digital-to-Analog converter(D/A) 디지털 값들을 아날로그 전압으로 변환하는 장치
  • Digitize(디지타이즈) 연속된 영상을 디지털 자료로 변환하는 과정. 이것은 샘플링(sampling)과 양자화를 포함한다.
  • Dithering(디더링) 회색 색조를 검은 점들로 흉내내는 방법. 이것은 또한 작은 색상들의 집합으로부터 많은 색상들을 생성하기 위해 사용된다.
  • Downsampling(다운샘플링) 하나의 영상을 더 작은 샘플로 표현하는 과정. 가장 대표적인 예가 영상을 1보다 작은 비율로 축소하는 것이다.
  • Encoder(인코더) 인코딩을 수행하는 시스템의 일부. 인코딩은 자료를 다른 형태로 변환하는 과정이다. 이것은 자료의 압축과 암호화를 포함한다.
  • Entropy coding(엔트로피 코딩) 원래의 자료를 좀더 효율적으로 표현하기 위해 통계적 중복성을 사용하는 인코딩 방법
  • Error diffusion(오류 유포) 컬러 영상이나 흑백 영상을 좀더 적은 양의 bits/pixel로 표현하기 위한 기술. 이것은 하나의 값을 추정하고 실제 값과 추정된 값 사이의 오류를 계산한다. 이 오류는 이웃화소들에게 유포 된다.
  • FFT(Fast Fourier Transform) Fourier 변환을 빠르게 수행할 수 있는 알고리즘
  • Filter(필터) 하나의 신호에서 특정한 부분을 제거하기 위한 기술 또는 장치. 영상에서 특정한 요소를 제거한다.
  • Finite impulse response filter(FIR) 출력이 현재의 입력과 이전 입력에 의존적인 비재귀적 디지털 필터.
  • Fovea 망막에서 cone들이 집중해 있는 작은 타원형의 파인 곳
  • Fourier Transform(퓨리어 변환) 영상 자료를 공간 영역에서 주파수 영역으로 변환하는 방법
  • Fractal compression(프렉탈 압축) 영상을 조각들로 표현될 수 있는 객체들의 집합으로 표현하는 영상 압축 기술.
  • Frame(프레임) 전체 영상. 비디오에서 프레임은 비디오 스트림에서 하나의 정지 영상이다.
  • Frame buffer(프레임 버퍼) 그래픽 시스템에서 출력 장치에 보여지는 자료를 저장하는 메모리. 이중버퍼 그래픽을 사용한다면 출력 장치는 두 개의 프레임 버퍼를 왔다갔다할 수 있다. 이것은 애니메이션에서 두 번째 프레임 버퍼에서 새로운 프레임을 만드는 동안 하나의 프레임을 화면에 표시하기 위해 사용된다.
  • Frame grabber(프레임 획득기) 비디오 시그널을 디지털화하기 위한 장치. 프레임 획득기로 NTSC 신호로부터 프레임들을 획득할 수 있고 이들을 디지털 영상 자료로 변환할 수 있다.
  • Frame process(프레임 처리) 두 개 이상의 영상에서 화소들에 대한 작업을 통해 화소값을 만들어 내는 과정
  • Frequency domain(주파수 영역) 하나의 신호를 그것의 기본 주파수 요소들로 표현 하는 것.
  • Frequency transform(주파수 변환) 하나의 영상을 기본적인 주파수 요소들로 변환하는 작업.
  • Gamma(감마) 영상 장치들의 비선형 특성들. 비선형 출력 장치에서, 낮은 밝기값의 작은 변화는 밝기값이 클 때와 같은 정도의 변화가 아니다.
  • Gamma correction(감마 보정) 영상 자료를 영상 장치들의 비선형성을 보정하기 위해 변경하는 기술. 이 변화는 출력 장치들이나 카메라에서 발생할 수 있다. 또한 자료들은 이러한 비 선형성을 보정하기에 앞서 소프트웨어적으로 처리할 수 있다.
  • Gaussian noise(가우시안형 잡음) 가우시안 히스토그램을 가진 형태의 잡음.
  • Geometric process(기하학 처리) 영상에서 화소들의 밝기값이 아니라 위치를 변화시키는 과정.
  • Gray scale(그레이 스케일) 검정색에서 백색에 이르는 밝기값들의 영역. 회색 영역은 전형적으로 256개지만 256개로 한정되지는 않는다.
  • Halftoning(간색) 이진 요소들의 배열을 통해 연속된 색조의 환상을 만들어 내는 과정. 이 요소들은 출력 장치의 화소가 될 수도 있고 종이나 제한된 숫자의 상태를 가지는 다른 영상 매체에 사용되는 검은 점일 수도 있다.
  • High pass filter(고주파 통과 필터) 저주파를 약화시키는 반면고주파를 허용하는 디지털 필터
  • Histogram(히스토 그램) 영상에서 화소의 밝기값을 표현하는 막대 그래프
  • Histogram equalization(히스토그램 평활화) 전체의 가능한 영역을 모두 채우기 위해 영상의 화소값들을 균일하게 분산시키는 기술.
  • HSI 또 다른 색상 공간. 이것은 색상, 채도, 밝기를 나타낸다. HSI 색상 공간은 원통 좌표계에 기반을 두고 있다. 밝기는 수직축인 Z축을 따라 증가한다. 색상은 각도이고 채도는 반지름이다.
  • Hue 주로 색상으로 참조되는 값. 기술적으로 hue는 색상의 파장에 대응된다.
  • Huffman coding(허프만 코딩) 무손실 자료 압축의 한 유형. 작은 비트 스트림이 자료의 발생 확률이 적다는 것을 나타낸다. 발생 확률이 높은 자료들은 더 많은 비트들을 요구한다.
  • Image analysis(영상 분석) 영상의 내용을 결정하기 위해 영상을 분석하는 연구 분야
  • Image compression(영상 압축) 하나의 영상을 표현하는 데 필요한자료의 양을 감소시키기 위한 기술의 부류
  • Image enhancement(영상 신장) 영상에서 선택적인 강조와 억제를 위해 사용되는 기술의 부류.
  • Impulse noise(충격 잡음) 극 값의 무작위 잡음
  • Infinite impulse response filter(IIR) 출력이 현재의 입력과 이전의 입력, 그리고 이전 출력에 의존적인 재귀적 필터.
  • Intensity(밝기) 빛의 크기나 힘.
  • Interpolation(보간) 주어진 주변의 점들로부터 잃어버린 자료를 생성해 내기 위해 사용되는 기술의 부류. 예를들어 양선형 보간법은 주어진 두 점들 사이의 선형 관계를 가정한다.
  • ISO(International Organization of Standardization) 국제 표준화 기구
  • JPEG(Joint Picture Experts Group) JPEG는 이 그룹에서 개발된 영상 압축 표준안으로 일반적으로 알려져 있다. 이러한 형태의 영상압축은 응용에 따라 손실이 있을 수도 있고 손실이 없을 수도있다.
  • Jaggies 영상에서 대각 윤곽선의 계단 형태. 이것은 에일리어싱의 결과이다.
  • Lightness(밝기) 스스로 빛을 발하지 않는 물체의 밝기
  • Look-up table(LUT:룩업 테이블) 색인들이 값을 가리키는 도표
  • Lossless encoding(무손실 코딩) 압축 과정에서 정보가 손실되지 않는 자료 압축 방법. 만약 어떤 영상이 무손실 알고리즘으로 압축되고 풀린다면 압축을 푼 영상은 원래의 영상과 일치한다.
  • Lossy encoding(손실 인코딩) 압축 과정에서 정보가 손실되는 자료 압축 방법. 손실된 정보는 북구될 수 없다. 원래의 영상과 압축되었다가 압축을 푼 영상의 차이는 감지될 수도 있고 감지되지 않을 수도 있다. 전형적으로, 손실 압축은 정보의 손실이 많을 수 록 압축률은 더욱 증가한다. 영상의 질과 압출률 사이에는 서로 장단점이 있다.
  • Low pass filter(저주파 통과 필터) 저주파를 보존하면서 고주파를 약화시키는 디지털 필터. 이 필터는 영상을 부드럽게 만들거나 흐리게 만든다.
  • Luminance(휘도) 화소의 밝기값
  • LZW(Lempel-Ziv-Welch algorithm) 중복되는 패턴들을 도표나 디렉토리에 저장하는 손실 자료 압축 알고리즘이다.
  • MRI(Magnetic resonance imaging;자기 공명 영상) 상호 중첩되는 단편 영상을 획득할 수 있는 단층 영상.
  • MSI(Magnetic source imaging) 생각중에 있는 뇌의 전기적 신호를 감지할 수 있는 영상 시스템.
  • Mach band effect(Mach 밴드 효과) 시각 시스템에서 서로 다른 밝기값을 가지는 경계선을 약화시키는 효과.
  • Machine vision(머신 비젼) 생산 환경의 제어를 위해 획득된 영상을 처리하는 기술
  • Magnification(확대) 영상을 확대하는 작업
  • Maximum filter(최대값 필터) 영상에서 한 화소의 주변 화소들에 윈도우를 씌워서 이웃 화소들 중에서 최대값을 출력 영상에 출력하는 필터링.
  • Median filter(중간값 필터) 영상에서 한 화소의 주변 화소들에 윈도우를 씌워서 이웃 화소들 중에서 중간값을 취하여 출력 영상에 출력하는 필터링.
  • Minification(축소) 영상을 축소하는 작업
  • Minimum filter(최소값 필터) 영상에서 한 화소의 주변 화소들에 윈도우를 씌워서 이웃 화소들 중에서 최소값을 출력 영상에 출력하는 필터링.
  • Moire patterns(무아레 패턴) 영상에서 감지 가능한 간섭 패턴. 흑백 영상을 스캔하는 과정에서 발생할 수 있다. 이러한 패턴들은 또한 컬러 출력에서 CMYK 중 하나 이상의 요소가 다른 요소들에 상대적으로 잘못 위치 하였을 때 발생한다.
  • Monochrome(모노크롬) 하나의 색상으로 이루어진. 이 용어는 흑백 영상과 초록색(또는 노랑색)의 그래픽 출력 장치를 표현하는 데 주로 사용되었다.
  • Morphing(모핑) 두 개 이상의 영상을 워핑과 상호 분해를 통해 혼합하는 과정
  • MPEG(Motion picture experts group) 이 그룹에서 비디오를 압축할 수 있는 알고리즘을 개발하였다. 전형적으로 MPEG 압축 알고리즘을 일컫는다.
  • NTSC(National Television System Committee) 미국의 컬러 텔레비젼을 위한 표준 협회
  • Nearest neighbor interpolation(가장 인접한 이웃 화소 보간법) 가장 인접한 값을 보간값으로 시용하는 간단한 보간 기법
  • Noise(잡음) 디지털 시스템에서 디지타이징, 전송 또는 다른 처리를 하는 동안 발생하는 신호값의 무작위 변환
  • Nyquist criterion 신호가 최고 주파수의 두 배 이상의 비율로 샘플되어야 한다는 제안 사항. 영상 획득시 이러한 제한 사항이 지켜지지 않으면 에일리어싱이 발생한다.
  • OCR(Optical character Recognition) OCR 시스템은 텍스트 문서를 스캐닝한 후, 결과 영상을 ASCII 파일로 변환할 수 있다.
  • PAL(Phase Alternation Line) 비디오 신호에 대한 유럽의 표준안
  • PET(Positron Emission Tomography) 횡단 자료을 획득할 수 있는 단층 영상 시스템. 기본적으로 신체의 화학적 처리를 감시하기 위해 사용된다.
  • Palette(팔레트) 실제 색상을 측정할 수 없는 시스템에서 전체 범위의 색상으로부터 선택된 색상의 집합. 컬러 맵의 룩업 테이블 부분이다.
  • Pel 'Picture element'의 약자
  • Perspective transform(투시 변환) 투영 정합이라고 불리는 기하 변환. 하나의 점을 통해 하나의 평면이 다른 평면으로 투영한다.
  • Photometer(포토미터) 밝기값을 측정하는 광학 장치
  • Photopic vision(포토픽 비젼) 좋은 조명하에서의 시각. Cone vision(콘 비젼)이라고도 불린다.
  • Pixel(화소) 영상의 기본 요소. 영상은 수많은 작은 점들로 이루어진다. 이들 점들을 화소라고 한다.
  • Point process(점 처리) 화소의 원래 밝기값이나 위치를 기반으로 화소의 밝기값을 변경시키는 영상처리
  • Posterization(포스터리제이션) 영상을 너무 작은 비트로 표현했기 때문에 발생할 수 있는 영상의 윤곽화 현상.
  • Pseudo color(유사 색상) 색이 없는 자료에 색을 부여하는 색 정합. 온도 표현을 위해 사용된다. 영상에서 낮은 온도는 푸른색으로 표현된다. 높은 온도는 붉은색으로 표현된다.
  • PX64 이산 코사인 변환(DCT)에 기반한 비디오 화상회의에 사용되는 영상압축 표준
  • Quantize(양자화) 아날로그 신호의 디지털 값을 결정하는 과정
  • Quantization error(양자화 오류) 연속적인 신호가 제한된 양자화 레벨로 표현될 때 발생하는 오류로 정밀도의감소를 초래한다. 오류는 원래 신호와의 차이이다.
  • Raster(래스터) 컴퓨터 출력 장치나 TV화면에 나타나는 스캔라인의 집합. 래스터 그래픽스는 열과 행으로 배치된 화소들의 배열로 구성된 영상을 말한다.
  • Reflectance(반사율) 물체로부터 반사되는 빛의 비율
  • Registration(등록) 두 개의 독립된 영상들을 재배열하는 처리. 주로 두 영상을 화소 단위로 비교하기 위해 사용된다.
  • Resampling(재추출) 이미 샘플된 자료를 다른 비율로 다시 샘플링 하는 것. 영상을 축소, 확대하는 작업을 포함한다.
  • Resolution(해상도) 영상 샘플의 척도. 프린터에서는 인치당 점수 수(dpi)로 정의한다. 이 용어는 영상의 면적을 나타낼 때도 사용된다.
  • Retina(망막) 빛의 처리를 담당하고 있는 눈 내부의 피막
  • RGB 빨강 초록, 파랑으로 구성된 부가 색상 공간. 이 색상 모델은 대부분 컴퓨터 그래픽스 출력 하드웨어에 사용된다.
  • Rods(간상체) 빛의 명암을 감지하는 눈의 감광장치
  • Run length encoding 간단한 비손실 자료 압축 알고리즘. 만약 255라는 같은 값을 가지는 50개의 화소가 연속적으로 나열되어 있으며, 이들 화소들은 50과 255의 두 숫자로 표현될 수 있다.
  • Salt and pepper noise 영상의 최소값과 최대값으로 구성된 잡음
  • Sampling 아날로그 비디오 신호를 이산 화소들로 나누는 것. 이 처리의 원래의 저의는 양자화를 포함하지 않는다.
  • Saturation(채도, 포화) 색상이 희색 빛으로부터 자유로운 것처럼 보이는 정도
  • Scaling 영상을 확대하거나 축소하는 기하학적 처리
  • Scanner(스캐너) 영상을 읽고 디지털로 바꿔주는 장치
  • Scan line(스캔 라인) 영상이나 출력 장치의한라인 또는 열
  • Scientific visualization(과학적 시각화) 직접적으로 관찰할 수 없는 자료들을 그래픽으로 표현하기 위한 연구 분야
  • Scotopic vision(암순응 시각) 어두움에 적응해야하 하는 환경하에서의 시각이 색상을 인지할 수 있는 능력이 감소한다는 특성을 가진다.
  • Segmentation(분할) 영상을 유사한 특성을 가지는 영역들로 나누는 처리. 이 처리는 주로 패턴 인식에서 첫번째로 수행된다.
  • Separability(분리성) 2차원의 연산이 2개의 1차원 연산으로 분할될 수 있도록 허용하는 특성. 이것은 계산상의 관점에서 볼 때 매우 효과적인 특성이다.
  • Sharpening(샤프닝) 고주파 보존 필터링에 기반을 둔 영상처리로 영상의 시각적 날카로움이 증가한다.
  • Spatial frequency(공간 주파수) 영상의 주기적 요소에 대한 특성화. 인접 화소들 사이의 밝기값의 변화가 고주파이다. 같은 밝기값을 가지는 영역이나 영상의 밝기값이 천천히 변화하는 부분은 저주파이다.
  • Subtractive color(차분 영상) 기본값을 흰색으로부터 뺌으로써 생성되는 색상.차분 색상의 기본 요소는 cyan, magenta, yellow이다.
  • Spatial domain(공간 영역) 영상자료의 일반적 영역. 위치에 대한 밝기값
  • Tile 비트 맵의 2차원 영역. JPEG 압축은 8*8 화소의 tile 연산을 수행한다.
  • TIFF(Tagged image file format) 그래픽 파일 포맷의 일종. 배우 유명하고 전자 출판에서 많이 사용된다.
  • Translation(이동) 영상이나 그 일부를 이동시키는 연산
  • Tristimulus values 어떤 특정한 색상 공간에서 색상을 표현하기 위한 세 가지 숫자.
  • True color(실 색상) 비트 수를 충분히 사용함으로써 색상이 시각적으로 완전하게 보이도록 그래픽을 표현하는 데 사용되는 형용사. 대부분의 책이나 응용 프로그램에서, 실 색상은 24비트 색상을 의미한다. 각 화소는 빨강색, 초록색, 파랑색의 3바이트 정보로 표현된다. 이 용어는 수년 동안 많이 사용되어 왔다. 이 용어는 그래픽 제품의 공급자 마다 서로 다른 의미로 사용되기도 한다.
  • Uniform noise(정규 잡음) 정규 히스토그램을 가지는 잡음
  • Unsharp masking 영상을 날카롭게 하기 위해 원래 영상에서 흐린 영상을 빼는 기술
  • Unsampling 이미 샘플된 영상의 샘플링 비율을 증가시키는 것. 이것은 스케이링 요소를 1보다 크게 함으로써 가능하다.
  • Vector graphics(벡터 그래픽스) 형태가 만들어지는 것을 기술함으로써 영상을 표현하는 방법. 벡터 그래픽스 파일은 선, 상자, 원을 그리기 위한 명령어와 인수들로 이루어진다.
  • Vector quantization(벡터 양자화) 영상의 타일들을 코드북의 색인으로 표현하는 손실 영상 압축 기법. 코드북은 많은 영상 패턴들에 대한 룩업 테이블이다.
  • Visual acuity(시각적 차이) 서로 다른 두 객체들이 서로 구분되는 정도
  • Volume rendering(볼륨 렌더링) 획득된 영상 자료의 3차원 모델을 나타내는 기술
  • Voxel(복셀) 3차원 화소. 화소와 같은 정보뿐 아니라 관찰점에서의 거리를 명시하는 정보도 포함한다.
  • Warping(워핑) 영상을 늘리거나 크기를 조절하는 기하학적인 처리. 순수한 스케일링과 달리 크기 변화의 정도가 영상 전체에 대해 균일하지 않다.
  • Wavelet transform(웨이블릿 변환) 하나의 신호를 매우간단한 기본 함수들로 재구성하는 변환
  • Windowing function(윈도우 함수) 퓨리어 변환을 적용하기 전에 영상에 적용되는 함수. 퓨리어 변환에서 주기적인 함수를 해석할 때 발생하는 영상 경계선의 불연속성을 감소시키기 위해 사용된다.
  • YIQ 북미 NTSC broadcast television에 사용되는 색상 모델. Y는 밝기값을, I와 Q는 색상을 나타낸다.
  • YUV 유럽 PAL broadcast television에 사용되는 색상 모델. Y는 밝기값을, U와 V는 색상을 나타낸다.
  • Zoom(확대) 영상이나 그 일부분을 확대하는 작업

  • '멀티미디어 > 이미지 프로세싱' 카테고리의 다른 글

    DCT 프로그램  (0) 2009.03.18
    H.264 tutoroals  (0) 2009.03.18
    YUV 420 포멧 viewer 및 소스 파일  (0) 2009.03.18
    JPEG 파일을 볼 수 있는 프로그램의 소스  (0) 2009.03.18
    Modeling AWGN channel  (0) 2009.03.18
    블로그 이미지

    맨오브파워

    한계를 뛰어 넘어서..........

    ,