DAMPER's blog

[ALGOSPOT] Quantization (QUANTIZE) 본문

Problem Solving/알고리즘 문제해결전략

[ALGOSPOT] Quantization (QUANTIZE)

DAMPER 2020. 11. 6. 11:16
728x90

algospot.com/judge/problem/read/QUANTIZE

 

algospot.com :: QUANTIZE

Quantization 문제 정보 문제 Quantization (양자화) 과정은, 더 넓은 범위를 갖는 값들을 작은 범위를 갖는 값들로 근사해 표현함으로써 자료를 손실 압축하는 과정을 말한다. 예를 들어 16비트 JPG 파일

algospot.com

<문제>

Quantization (양자화) 과정은, 더 넓은 범위를 갖는 값들을 작은 범위를 갖는 값들로 근사해 표현함으로써 자료를 손실 압축하는 과정을 말한다. 예를 들어 16비트 JPG 파일을 4컬러 GIF 파일로 변환하는 것은 RGB 색 공간의 색들을 4컬러 중의 하나로 양자화하는 것이고, 키가 161, 164, 170, 178 인 학생 넷을 '160대 둘, 170대 둘' 이라고 축약해 표현하는 것 또한 양자화라고 할 수 있다.

1000 이하의 자연수들로 구성된 수열을 최대 S종류 의 값만을 사용하도록 양자화하고 싶다. 이 때 양자화된 숫자는 원래 수열에 없는 숫자일 수도 있다. 양자화를 하는 방법은 여러 가지가 있다. 수열 1 2 3 4 5 6 7 8 9 10 을 2개의 숫자만을 써서 표현하려면, 3 3 3 3 3 7 7 7 7 7 과 같이 할 수도 있고, 1 1 1 1 1 10 10 10 10 10 으로 할 수도 있다. 우리는 이 중, 각 숫자별 오차 제곱의 합을 최소화하는 양자화 결과를 알고 싶다.

예를 들어, 수열 1 2 3 4 5 를 1 1 3 3 3 으로 양자화하면 오차 제곱의 합은 0+1+0+1+4=6 이 되고, 2 2 2 4 4 로 양자화하면 오차 제곱의 합은 1+0+1+0+1=3 이 된다.

수열과 S 가 주어질 때, 가능한 오차 제곱의 합의 최소값을 구하는 프로그램을 작성하시오.

 

<입력>

입력의 첫 줄에는 테스트 케이스의 수 C (1 <= C <= 50) 가 주어진다. 각 테스트 케이스의 첫 줄에는 수열의 길이 N (1 <= N <= 100), 사용할 숫자의 수 S (1 <= S <= 10) 이 주어진다. 그 다음 줄에 N개의 정수로 수열의 숫자들이 주어진다. 수열의 모든 수는 1000 이하의 자연수이다.

 

<출력>

각 테스트 케이스마다, 주어진 수열을 최대 S 개의 수로 양자화할 때 오차 제곱의 합의 최소값을 출력한다.

 

<예제 입력>

2

10 3

3 3 3 1 2 3 2 2 2 1

9 3

1 744 755 4 897 902 890 6 777

 

<예제 출력>

0

651

 

너무 어려워서 몇날며칠을 고민했지만 결국 답을 본 문제입니다ㅠㅠ

사실 책을 봐도 모든 부분이 이해된 것은 아니고 그냥 부분부분 이해한 느낌....

나중에 다시 읽어보면서 복기해야 할 듯 합니다.

 

 

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
#include <bits/stdc++.h>
using namespace std;
#define swap(a,b) (a)^=(b)^=(a)^=(b)
#define endl '\n'
typedef long long lld;
 
int n;
lld a[101], p_sum[101], p_sq_sum[101];
 
void precalc()
{
    sort(a, a+n);
    p_sum[0= a[0];
    p_sq_sum[0= a[0]*a[0];
    for(int i=1;i<n;i++)
    {
        p_sum[i] = p_sum[i-1]+a[i];
        p_sq_sum[i] = p_sq_sum[i-1]+a[i]*a[i];
    }
}
 
lld minError(int lo, int hi)
{
    lld sum = p_sum[hi] - (lo==0?0:p_sum[lo-1]);
    lld sq_sum = p_sq_sum[hi] - (lo==0?0:p_sq_sum[lo-1]);
    lld m = lld(0.5 + (double)sum/(hi-lo+1));
    lld ret = sq_sum -2*m*sum + m*m*(hi-lo+1);
    return ret;
}
 
lld cache[101][11];
 
lld qantize(int from, int parts)
{
    if(from==n) return 0;
    if(parts == 0return INT_MAX;
    lld& ret = cache[from][parts];
    if(ret!=-1return ret;
    ret = INT_MAX;
    for(int part_size = 1;from+part_size<=n; part_size++)
    {
        ret = min(ret, minError(from, from+part_size-1)+qantize(from+part_size, parts-1));
    }
    return ret;
}
 
int main()
{
    ios_base::sync_with_stdio(NULL);
    cin.tie(NULL);
    cout.tie(NULL);
    
    int tc;
    cin>>tc;
    while(tc--)
    {
        int s;
        cin>>n>>s;
        for(int i=0;i<n;i++)
            cin>>a[i];
        memset(cache, -1sizeof(cache));
        precalc();
        cout<<qantize(0, s)<<endl;
    }
 
    return 0;
}
cs

 

728x90

'Problem Solving > 알고리즘 문제해결전략' 카테고리의 다른 글

[ALGOSPOT] TRIPATHCNT  (0) 2020.11.06
[ALGOSPOT] 타일링 (TILING2)  (0) 2020.11.06
[ALGOSPOT] PI  (0) 2020.10.16
[ALGOSPOT] JLIS  (0) 2020.10.16
[ALGOSPOT] LIS  (0) 2020.10.16