audlegacy-plugins: src/ffmpeg/libavcodec/jrevdct.c annotate

annotate src/ffmpeg/libavcodec/jrevdct.c @ 811:3afe5701df41 trunk

[svn] - remove h261/h263/h264 stuff

author	nenolod
date	Mon, 12 Mar 2007 11:38:51 -0700
parents	e8776388b02a
children

rev	line source
808 e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1 /*
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	2 * jrevdct.c
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	3 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	4 * This file is part of the Independent JPEG Group's software.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	5 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	6 * The authors make NO WARRANTY or representation, either express or implied,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	7 * with respect to this software, its quality, accuracy, merchantability, or
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	8 * fitness for a particular purpose. This software is provided "AS IS", and
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	9 * you, its user, assume the entire risk as to its quality and accuracy.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	10 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	11 * This software is copyright (C) 1991, 1992, Thomas G. Lane.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	12 * All Rights Reserved except as specified below.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	13 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	14 * Permission is hereby granted to use, copy, modify, and distribute this
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	15 * software (or portions thereof) for any purpose, without fee, subject to
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	16 * these conditions:
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	17 * (1) If any part of the source code for this software is distributed, then
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	18 * this README file must be included, with this copyright and no-warranty
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	19 * notice unaltered; and any additions, deletions, or changes to the original
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	20 * files must be clearly indicated in accompanying documentation.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	21 * (2) If only executable code is distributed, then the accompanying
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	22 * documentation must state that "this software is based in part on the work
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	23 * of the Independent JPEG Group".
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	24 * (3) Permission for use of this software is granted only if the user accepts
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	25 * full responsibility for any undesirable consequences; the authors accept
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	26 * NO LIABILITY for damages of any kind.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	27 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	28 * These conditions apply to any software derived from or based on the IJG
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	29 * code, not just to the unmodified library. If you use our work, you ought
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	30 * to acknowledge us.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	31 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	32 * Permission is NOT granted for the use of any IJG author's name or company
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	33 * name in advertising or publicity relating to this software or products
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	34 * derived from it. This software may be referred to only as "the Independent
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	35 * JPEG Group's software".
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	36 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	37 * We specifically permit and encourage the use of this software as the basis
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	38 * of commercial products, provided that all warranty or liability claims are
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	39 * assumed by the product vendor.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	40 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	41 * This file contains the basic inverse-DCT transformation subroutine.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	42 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	43 * This implementation is based on an algorithm described in
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	44 * C. Loeffler, A. Ligtenberg and G. Moschytz, "Practical Fast 1-D DCT
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	45 * Algorithms with 11 Multiplications", Proc. Int'l. Conf. on Acoustics,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	46 * Speech, and Signal Processing 1989 (ICASSP '89), pp. 988-991.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	47 * The primary algorithm described there uses 11 multiplies and 29 adds.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	48 * We use their alternate method with 12 multiplies and 32 adds.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	49 * The advantage of this method is that no data path contains more than one
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	50 * multiplication; this allows a very simple and accurate implementation in
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	51 * scaled fixed-point arithmetic, with a minimal number of shifts.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	52 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	53 * I've made lots of modifications to attempt to take advantage of the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	54 * sparse nature of the DCT matrices we're getting. Although the logic
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	55 * is cumbersome, it's straightforward and the resulting code is much
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	56 * faster.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	57 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	58 * A better way to do this would be to pass in the DCT block as a sparse
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	59 * matrix, perhaps with the difference cases encoded.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	60 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	61
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	62 /**
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	63 * @file jrevdct.c
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	64 * Independent JPEG Group's LLM idct.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	65 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	66
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	67 #include "common.h"
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	68 #include "dsputil.h"
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	69
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	70 #define EIGHT_BIT_SAMPLES
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	71
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	72 #define DCTSIZE 8
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	73 #define DCTSIZE2 64
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	74
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	75 #define GLOBAL
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	76
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	77 #define RIGHT_SHIFT(x, n) ((x) >> (n))
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	78
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	79 typedef DCTELEM DCTBLOCK[DCTSIZE2];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	80
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	81 #define CONST_BITS 13
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	82
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	83 /*
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	84 * This routine is specialized to the case DCTSIZE = 8.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	85 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	86
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	87 #if DCTSIZE != 8
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	88 Sorry, this code only copes with 8x8 DCTs. /* deliberate syntax err */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	89 #endif
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	90
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	91
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	92 /*
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	93 * A 2-D IDCT can be done by 1-D IDCT on each row followed by 1-D IDCT
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	94 * on each column. Direct algorithms are also available, but they are
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	95 * much more complex and seem not to be any faster when reduced to code.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	96 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	97 * The poop on this scaling stuff is as follows:
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	98 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	99 * Each 1-D IDCT step produces outputs which are a factor of sqrt(N)
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	100 * larger than the true IDCT outputs. The final outputs are therefore
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	101 * a factor of N larger than desired; since N=8 this can be cured by
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	102 * a simple right shift at the end of the algorithm. The advantage of
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	103 * this arrangement is that we save two multiplications per 1-D IDCT,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	104 * because the y0 and y4 inputs need not be divided by sqrt(N).
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	105 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	106 * We have to do addition and subtraction of the integer inputs, which
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	107 * is no problem, and multiplication by fractional constants, which is
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	108 * a problem to do in integer arithmetic. We multiply all the constants
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	109 * by CONST_SCALE and convert them to integer constants (thus retaining
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	110 * CONST_BITS bits of precision in the constants). After doing a
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	111 * multiplication we have to divide the product by CONST_SCALE, with proper
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	112 * rounding, to produce the correct output. This division can be done
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	113 * cheaply as a right shift of CONST_BITS bits. We postpone shifting
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	114 * as long as possible so that partial sums can be added together with
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	115 * full fractional precision.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	116 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	117 * The outputs of the first pass are scaled up by PASS1_BITS bits so that
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	118 * they are represented to better-than-integral precision. These outputs
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	119 * require BITS_IN_JSAMPLE + PASS1_BITS + 3 bits; this fits in a 16-bit word
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	120 * with the recommended scaling. (To scale up 12-bit sample data further, an
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	121 * intermediate int32 array would be needed.)
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	122 *
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	123 * To avoid overflow of the 32-bit intermediate results in pass 2, we must
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	124 * have BITS_IN_JSAMPLE + CONST_BITS + PASS1_BITS <= 26. Error analysis
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	125 * shows that the values given below are the most effective.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	126 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	127
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	128 #ifdef EIGHT_BIT_SAMPLES
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	129 #define PASS1_BITS 2
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	130 #else
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	131 #define PASS1_BITS 1 /* lose a little precision to avoid overflow */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	132 #endif
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	133
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	134 #define ONE ((int32_t) 1)
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	135
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	136 #define CONST_SCALE (ONE << CONST_BITS)
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	137
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	138 /* Convert a positive real constant to an integer scaled by CONST_SCALE.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	139 * IMPORTANT: if your compiler doesn't do this arithmetic at compile time,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	140 * you will pay a significant penalty in run time. In that case, figure
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	141 * the correct integer constant values and insert them by hand.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	142 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	143
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	144 /* Actually FIX is no longer used, we precomputed them all */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	145 #define FIX(x) ((int32_t) ((x) * CONST_SCALE + 0.5))
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	146
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	147 /* Descale and correctly round an int32_t value that's scaled by N bits.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	148 * We assume RIGHT_SHIFT rounds towards minus infinity, so adding
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	149 * the fudge factor is correct for either sign of X.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	150 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	151
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	152 #define DESCALE(x,n) RIGHT_SHIFT((x) + (ONE << ((n)-1)), n)
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	153
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	154 /* Multiply an int32_t variable by an int32_t constant to yield an int32_t result.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	155 * For 8-bit samples with the recommended scaling, all the variable
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	156 * and constant values involved are no more than 16 bits wide, so a
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	157 * 16x16->32 bit multiply can be used instead of a full 32x32 multiply;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	158 * this provides a useful speedup on many machines.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	159 * There is no way to specify a 16x16->32 multiply in portable C, but
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	160 * some C compilers will do the right thing if you provide the correct
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	161 * combination of casts.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	162 * NB: for 12-bit samples, a full 32-bit multiplication will be needed.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	163 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	164
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	165 #ifdef EIGHT_BIT_SAMPLES
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	166 #ifdef SHORTxSHORT_32 /* may work if 'int' is 32 bits */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	167 #define MULTIPLY(var,const) (((int16_t) (var)) * ((int16_t) (const)))
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	168 #endif
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	169 #ifdef SHORTxLCONST_32 /* known to work with Microsoft C 6.0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	170 #define MULTIPLY(var,const) (((int16_t) (var)) * ((int32_t) (const)))
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	171 #endif
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	172 #endif
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	173
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	174 #ifndef MULTIPLY /* default definition */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	175 #define MULTIPLY(var,const) ((var) * (const))
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	176 #endif
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	177
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	178
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	179 /*
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	180 Unlike our decoder where we approximate the FIXes, we need to use exact
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	181 ones here or successive P-frames will drift too much with Reference frame coding
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	182 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	183 #define FIX_0_211164243 1730
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	184 #define FIX_0_275899380 2260
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	185 #define FIX_0_298631336 2446
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	186 #define FIX_0_390180644 3196
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	187 #define FIX_0_509795579 4176
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	188 #define FIX_0_541196100 4433
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	189 #define FIX_0_601344887 4926
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	190 #define FIX_0_765366865 6270
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	191 #define FIX_0_785694958 6436
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	192 #define FIX_0_899976223 7373
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	193 #define FIX_1_061594337 8697
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	194 #define FIX_1_111140466 9102
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	195 #define FIX_1_175875602 9633
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	196 #define FIX_1_306562965 10703
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	197 #define FIX_1_387039845 11363
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	198 #define FIX_1_451774981 11893
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	199 #define FIX_1_501321110 12299
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	200 #define FIX_1_662939225 13623
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	201 #define FIX_1_847759065 15137
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	202 #define FIX_1_961570560 16069
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	203 #define FIX_2_053119869 16819
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	204 #define FIX_2_172734803 17799
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	205 #define FIX_2_562915447 20995
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	206 #define FIX_3_072711026 25172
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	207
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	208 /*
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	209 * Perform the inverse DCT on one block of coefficients.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	210 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	211
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	212 void j_rev_dct(DCTBLOCK data)
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	213 {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	214 int32_t tmp0, tmp1, tmp2, tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	215 int32_t tmp10, tmp11, tmp12, tmp13;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	216 int32_t z1, z2, z3, z4, z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	217 int32_t d0, d1, d2, d3, d4, d5, d6, d7;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	218 register DCTELEM *dataptr;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	219 int rowctr;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	220
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	221 /* Pass 1: process rows. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	222 /* Note results are scaled up by sqrt(8) compared to a true IDCT; */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	223 /* furthermore, we scale the results by 2*PASS1_BITS. /
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	224
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	225 dataptr = data;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	226
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	227 for (rowctr = DCTSIZE-1; rowctr >= 0; rowctr--) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	228 /* Due to quantization, we will usually find that many of the input
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	229 * coefficients are zero, especially the AC terms. We can exploit this
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	230 * by short-circuiting the IDCT calculation for any row in which all
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	231 * the AC terms are zero. In that case each output is equal to the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	232 * DC coefficient (with scale factor as needed).
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	233 * With typical images and quantization tables, half or more of the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	234 * row DCT calculations can be simplified this way.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	235 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	236
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	237 register int idataptr = (int)dataptr;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	238
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	239 /* WARNING: we do the same permutation as MMX idct to simplify the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	240 video core */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	241 d0 = dataptr[0];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	242 d2 = dataptr[1];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	243 d4 = dataptr[2];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	244 d6 = dataptr[3];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	245 d1 = dataptr[4];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	246 d3 = dataptr[5];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	247 d5 = dataptr[6];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	248 d7 = dataptr[7];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	249
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	250 if ((d1 \| d2 \| d3 \| d4 \| d5 \| d6 \| d7) == 0) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	251 /* AC terms all zero */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	252 if (d0) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	253 /* Compute a 32 bit value to assign. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	254 DCTELEM dcval = (DCTELEM) (d0 << PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	255 register int v = (dcval & 0xffff) \| ((dcval << 16) & 0xffff0000);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	256
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	257 idataptr[0] = v;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	258 idataptr[1] = v;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	259 idataptr[2] = v;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	260 idataptr[3] = v;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	261 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	262
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	263 dataptr += DCTSIZE; /* advance pointer to next row */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	264 continue;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	265 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	266
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	267 /* Even part: reverse the even part of the forward DCT. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	268 /* The rotator is sqrt(2)c(-6). /
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	269 {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	270 if (d6) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	271 if (d2) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	272 /* d0 != 0, d2 != 0, d4 != 0, d6 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	273 z1 = MULTIPLY(d2 + d6, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	274 tmp2 = z1 + MULTIPLY(-d6, FIX_1_847759065);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	275 tmp3 = z1 + MULTIPLY(d2, FIX_0_765366865);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	276
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	277 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	278 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	279
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	280 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	281 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	282 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	283 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	284 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	285 /* d0 != 0, d2 == 0, d4 != 0, d6 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	286 tmp2 = MULTIPLY(-d6, FIX_1_306562965);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	287 tmp3 = MULTIPLY(d6, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	288
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	289 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	290 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	291
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	292 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	293 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	294 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	295 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	296 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	297 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	298 if (d2) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	299 /* d0 != 0, d2 != 0, d4 != 0, d6 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	300 tmp2 = MULTIPLY(d2, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	301 tmp3 = MULTIPLY(d2, FIX_1_306562965);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	302
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	303 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	304 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	305
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	306 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	307 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	308 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	309 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	310 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	311 /* d0 != 0, d2 == 0, d4 != 0, d6 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	312 tmp10 = tmp13 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	313 tmp11 = tmp12 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	314 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	315 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	316
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	317 /* Odd part per figure 8; the matrix is unitary and hence its
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	318 * transpose is its inverse. i0..i3 are y7,y5,y3,y1 respectively.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	319 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	320
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	321 if (d7) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	322 if (d5) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	323 if (d3) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	324 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	325 /* d1 != 0, d3 != 0, d5 != 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	326 z1 = d7 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	327 z2 = d5 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	328 z3 = d7 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	329 z4 = d5 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	330 z5 = MULTIPLY(z3 + z4, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	331
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	332 tmp0 = MULTIPLY(d7, FIX_0_298631336);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	333 tmp1 = MULTIPLY(d5, FIX_2_053119869);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	334 tmp2 = MULTIPLY(d3, FIX_3_072711026);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	335 tmp3 = MULTIPLY(d1, FIX_1_501321110);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	336 z1 = MULTIPLY(-z1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	337 z2 = MULTIPLY(-z2, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	338 z3 = MULTIPLY(-z3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	339 z4 = MULTIPLY(-z4, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	340
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	341 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	342 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	343
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	344 tmp0 += z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	345 tmp1 += z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	346 tmp2 += z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	347 tmp3 += z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	348 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	349 /* d1 == 0, d3 != 0, d5 != 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	350 z2 = d5 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	351 z3 = d7 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	352 z5 = MULTIPLY(z3 + d5, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	353
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	354 tmp0 = MULTIPLY(d7, FIX_0_298631336);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	355 tmp1 = MULTIPLY(d5, FIX_2_053119869);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	356 tmp2 = MULTIPLY(d3, FIX_3_072711026);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	357 z1 = MULTIPLY(-d7, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	358 z2 = MULTIPLY(-z2, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	359 z3 = MULTIPLY(-z3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	360 z4 = MULTIPLY(-d5, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	361
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	362 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	363 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	364
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	365 tmp0 += z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	366 tmp1 += z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	367 tmp2 += z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	368 tmp3 = z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	369 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	370 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	371 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	372 /* d1 != 0, d3 == 0, d5 != 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	373 z1 = d7 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	374 z4 = d5 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	375 z5 = MULTIPLY(d7 + z4, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	376
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	377 tmp0 = MULTIPLY(d7, FIX_0_298631336);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	378 tmp1 = MULTIPLY(d5, FIX_2_053119869);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	379 tmp3 = MULTIPLY(d1, FIX_1_501321110);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	380 z1 = MULTIPLY(-z1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	381 z2 = MULTIPLY(-d5, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	382 z3 = MULTIPLY(-d7, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	383 z4 = MULTIPLY(-z4, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	384
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	385 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	386 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	387
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	388 tmp0 += z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	389 tmp1 += z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	390 tmp2 = z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	391 tmp3 += z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	392 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	393 /* d1 == 0, d3 == 0, d5 != 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	394 tmp0 = MULTIPLY(-d7, FIX_0_601344887);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	395 z1 = MULTIPLY(-d7, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	396 z3 = MULTIPLY(-d7, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	397 tmp1 = MULTIPLY(-d5, FIX_0_509795579);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	398 z2 = MULTIPLY(-d5, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	399 z4 = MULTIPLY(-d5, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	400 z5 = MULTIPLY(d5 + d7, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	401
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	402 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	403 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	404
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	405 tmp0 += z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	406 tmp1 += z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	407 tmp2 = z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	408 tmp3 = z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	409 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	410 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	411 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	412 if (d3) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	413 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	414 /* d1 != 0, d3 != 0, d5 == 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	415 z1 = d7 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	416 z3 = d7 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	417 z5 = MULTIPLY(z3 + d1, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	418
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	419 tmp0 = MULTIPLY(d7, FIX_0_298631336);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	420 tmp2 = MULTIPLY(d3, FIX_3_072711026);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	421 tmp3 = MULTIPLY(d1, FIX_1_501321110);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	422 z1 = MULTIPLY(-z1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	423 z2 = MULTIPLY(-d3, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	424 z3 = MULTIPLY(-z3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	425 z4 = MULTIPLY(-d1, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	426
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	427 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	428 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	429
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	430 tmp0 += z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	431 tmp1 = z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	432 tmp2 += z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	433 tmp3 += z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	434 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	435 /* d1 == 0, d3 != 0, d5 == 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	436 z3 = d7 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	437
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	438 tmp0 = MULTIPLY(-d7, FIX_0_601344887);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	439 z1 = MULTIPLY(-d7, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	440 tmp2 = MULTIPLY(d3, FIX_0_509795579);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	441 z2 = MULTIPLY(-d3, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	442 z5 = MULTIPLY(z3, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	443 z3 = MULTIPLY(-z3, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	444
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	445 tmp0 += z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	446 tmp1 = z2 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	447 tmp2 += z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	448 tmp3 = z1 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	449 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	450 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	451 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	452 /* d1 != 0, d3 == 0, d5 == 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	453 z1 = d7 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	454 z5 = MULTIPLY(z1, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	455
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	456 z1 = MULTIPLY(z1, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	457 z3 = MULTIPLY(-d7, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	458 tmp0 = MULTIPLY(-d7, FIX_1_662939225);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	459 z4 = MULTIPLY(-d1, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	460 tmp3 = MULTIPLY(d1, FIX_1_111140466);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	461
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	462 tmp0 += z1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	463 tmp1 = z4 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	464 tmp2 = z3 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	465 tmp3 += z1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	466 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	467 /* d1 == 0, d3 == 0, d5 == 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	468 tmp0 = MULTIPLY(-d7, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	469 tmp1 = MULTIPLY(d7, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	470 tmp2 = MULTIPLY(-d7, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	471 tmp3 = MULTIPLY(d7, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	472 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	473 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	474 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	475 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	476 if (d5) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	477 if (d3) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	478 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	479 /* d1 != 0, d3 != 0, d5 != 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	480 z2 = d5 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	481 z4 = d5 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	482 z5 = MULTIPLY(d3 + z4, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	483
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	484 tmp1 = MULTIPLY(d5, FIX_2_053119869);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	485 tmp2 = MULTIPLY(d3, FIX_3_072711026);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	486 tmp3 = MULTIPLY(d1, FIX_1_501321110);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	487 z1 = MULTIPLY(-d1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	488 z2 = MULTIPLY(-z2, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	489 z3 = MULTIPLY(-d3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	490 z4 = MULTIPLY(-z4, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	491
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	492 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	493 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	494
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	495 tmp0 = z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	496 tmp1 += z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	497 tmp2 += z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	498 tmp3 += z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	499 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	500 /* d1 == 0, d3 != 0, d5 != 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	501 z2 = d5 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	502
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	503 z5 = MULTIPLY(z2, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	504 tmp1 = MULTIPLY(d5, FIX_1_662939225);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	505 z4 = MULTIPLY(-d5, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	506 z2 = MULTIPLY(-z2, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	507 tmp2 = MULTIPLY(d3, FIX_1_111140466);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	508 z3 = MULTIPLY(-d3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	509
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	510 tmp0 = z3 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	511 tmp1 += z2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	512 tmp2 += z2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	513 tmp3 = z4 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	514 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	515 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	516 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	517 /* d1 != 0, d3 == 0, d5 != 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	518 z4 = d5 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	519
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	520 z5 = MULTIPLY(z4, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	521 z1 = MULTIPLY(-d1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	522 tmp3 = MULTIPLY(d1, FIX_0_601344887);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	523 tmp1 = MULTIPLY(-d5, FIX_0_509795579);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	524 z2 = MULTIPLY(-d5, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	525 z4 = MULTIPLY(z4, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	526
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	527 tmp0 = z1 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	528 tmp1 += z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	529 tmp2 = z2 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	530 tmp3 += z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	531 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	532 /* d1 == 0, d3 == 0, d5 != 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	533 tmp0 = MULTIPLY(d5, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	534 tmp1 = MULTIPLY(d5, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	535 tmp2 = MULTIPLY(-d5, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	536 tmp3 = MULTIPLY(d5, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	537 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	538 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	539 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	540 if (d3) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	541 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	542 /* d1 != 0, d3 != 0, d5 == 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	543 z5 = d1 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	544 tmp3 = MULTIPLY(d1, FIX_0_211164243);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	545 tmp2 = MULTIPLY(-d3, FIX_1_451774981);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	546 z1 = MULTIPLY(d1, FIX_1_061594337);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	547 z2 = MULTIPLY(-d3, FIX_2_172734803);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	548 z4 = MULTIPLY(z5, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	549 z5 = MULTIPLY(z5, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	550
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	551 tmp0 = z1 - z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	552 tmp1 = z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	553 tmp2 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	554 tmp3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	555 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	556 /* d1 == 0, d3 != 0, d5 == 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	557 tmp0 = MULTIPLY(-d3, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	558 tmp1 = MULTIPLY(-d3, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	559 tmp2 = MULTIPLY(-d3, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	560 tmp3 = MULTIPLY(d3, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	561 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	562 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	563 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	564 /* d1 != 0, d3 == 0, d5 == 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	565 tmp0 = MULTIPLY(d1, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	566 tmp1 = MULTIPLY(d1, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	567 tmp2 = MULTIPLY(d1, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	568 tmp3 = MULTIPLY(d1, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	569 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	570 /* d1 == 0, d3 == 0, d5 == 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	571 tmp0 = tmp1 = tmp2 = tmp3 = 0;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	572 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	573 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	574 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	575 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	576 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	577 /* Final output stage: inputs are tmp10..tmp13, tmp0..tmp3 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	578
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	579 dataptr[0] = (DCTELEM) DESCALE(tmp10 + tmp3, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	580 dataptr[7] = (DCTELEM) DESCALE(tmp10 - tmp3, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	581 dataptr[1] = (DCTELEM) DESCALE(tmp11 + tmp2, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	582 dataptr[6] = (DCTELEM) DESCALE(tmp11 - tmp2, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	583 dataptr[2] = (DCTELEM) DESCALE(tmp12 + tmp1, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	584 dataptr[5] = (DCTELEM) DESCALE(tmp12 - tmp1, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	585 dataptr[3] = (DCTELEM) DESCALE(tmp13 + tmp0, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	586 dataptr[4] = (DCTELEM) DESCALE(tmp13 - tmp0, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	587
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	588 dataptr += DCTSIZE; /* advance pointer to next row */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	589 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	590
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	591 /* Pass 2: process columns. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	592 /* Note that we must descale the results by a factor of 8 == 2*3, /
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	593 /* and also undo the PASS1_BITS scaling. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	594
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	595 dataptr = data;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	596 for (rowctr = DCTSIZE-1; rowctr >= 0; rowctr--) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	597 /* Columns of zeroes can be exploited in the same way as we did with rows.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	598 * However, the row calculation has created many nonzero AC terms, so the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	599 * simplification applies less often (typically 5% to 10% of the time).
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	600 * On machines with very fast multiplication, it's possible that the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	601 * test takes more time than it's worth. In that case this section
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	602 * may be commented out.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	603 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	604
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	605 d0 = dataptr[DCTSIZE*0];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	606 d1 = dataptr[DCTSIZE*1];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	607 d2 = dataptr[DCTSIZE*2];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	608 d3 = dataptr[DCTSIZE*3];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	609 d4 = dataptr[DCTSIZE*4];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	610 d5 = dataptr[DCTSIZE*5];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	611 d6 = dataptr[DCTSIZE*6];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	612 d7 = dataptr[DCTSIZE*7];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	613
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	614 /* Even part: reverse the even part of the forward DCT. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	615 /* The rotator is sqrt(2)c(-6). /
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	616 if (d6) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	617 if (d2) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	618 /* d0 != 0, d2 != 0, d4 != 0, d6 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	619 z1 = MULTIPLY(d2 + d6, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	620 tmp2 = z1 + MULTIPLY(-d6, FIX_1_847759065);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	621 tmp3 = z1 + MULTIPLY(d2, FIX_0_765366865);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	622
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	623 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	624 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	625
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	626 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	627 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	628 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	629 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	630 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	631 /* d0 != 0, d2 == 0, d4 != 0, d6 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	632 tmp2 = MULTIPLY(-d6, FIX_1_306562965);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	633 tmp3 = MULTIPLY(d6, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	634
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	635 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	636 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	637
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	638 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	639 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	640 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	641 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	642 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	643 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	644 if (d2) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	645 /* d0 != 0, d2 != 0, d4 != 0, d6 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	646 tmp2 = MULTIPLY(d2, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	647 tmp3 = MULTIPLY(d2, FIX_1_306562965);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	648
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	649 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	650 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	651
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	652 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	653 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	654 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	655 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	656 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	657 /* d0 != 0, d2 == 0, d4 != 0, d6 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	658 tmp10 = tmp13 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	659 tmp11 = tmp12 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	660 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	661 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	662
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	663 /* Odd part per figure 8; the matrix is unitary and hence its
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	664 * transpose is its inverse. i0..i3 are y7,y5,y3,y1 respectively.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	665 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	666 if (d7) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	667 if (d5) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	668 if (d3) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	669 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	670 /* d1 != 0, d3 != 0, d5 != 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	671 z1 = d7 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	672 z2 = d5 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	673 z3 = d7 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	674 z4 = d5 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	675 z5 = MULTIPLY(z3 + z4, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	676
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	677 tmp0 = MULTIPLY(d7, FIX_0_298631336);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	678 tmp1 = MULTIPLY(d5, FIX_2_053119869);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	679 tmp2 = MULTIPLY(d3, FIX_3_072711026);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	680 tmp3 = MULTIPLY(d1, FIX_1_501321110);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	681 z1 = MULTIPLY(-z1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	682 z2 = MULTIPLY(-z2, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	683 z3 = MULTIPLY(-z3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	684 z4 = MULTIPLY(-z4, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	685
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	686 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	687 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	688
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	689 tmp0 += z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	690 tmp1 += z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	691 tmp2 += z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	692 tmp3 += z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	693 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	694 /* d1 == 0, d3 != 0, d5 != 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	695 z1 = d7;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	696 z2 = d5 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	697 z3 = d7 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	698 z5 = MULTIPLY(z3 + d5, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	699
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	700 tmp0 = MULTIPLY(d7, FIX_0_298631336);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	701 tmp1 = MULTIPLY(d5, FIX_2_053119869);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	702 tmp2 = MULTIPLY(d3, FIX_3_072711026);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	703 z1 = MULTIPLY(-d7, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	704 z2 = MULTIPLY(-z2, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	705 z3 = MULTIPLY(-z3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	706 z4 = MULTIPLY(-d5, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	707
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	708 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	709 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	710
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	711 tmp0 += z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	712 tmp1 += z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	713 tmp2 += z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	714 tmp3 = z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	715 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	716 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	717 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	718 /* d1 != 0, d3 == 0, d5 != 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	719 z1 = d7 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	720 z2 = d5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	721 z3 = d7;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	722 z4 = d5 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	723 z5 = MULTIPLY(z3 + z4, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	724
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	725 tmp0 = MULTIPLY(d7, FIX_0_298631336);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	726 tmp1 = MULTIPLY(d5, FIX_2_053119869);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	727 tmp3 = MULTIPLY(d1, FIX_1_501321110);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	728 z1 = MULTIPLY(-z1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	729 z2 = MULTIPLY(-d5, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	730 z3 = MULTIPLY(-d7, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	731 z4 = MULTIPLY(-z4, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	732
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	733 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	734 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	735
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	736 tmp0 += z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	737 tmp1 += z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	738 tmp2 = z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	739 tmp3 += z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	740 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	741 /* d1 == 0, d3 == 0, d5 != 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	742 tmp0 = MULTIPLY(-d7, FIX_0_601344887);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	743 z1 = MULTIPLY(-d7, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	744 z3 = MULTIPLY(-d7, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	745 tmp1 = MULTIPLY(-d5, FIX_0_509795579);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	746 z2 = MULTIPLY(-d5, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	747 z4 = MULTIPLY(-d5, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	748 z5 = MULTIPLY(d5 + d7, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	749
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	750 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	751 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	752
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	753 tmp0 += z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	754 tmp1 += z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	755 tmp2 = z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	756 tmp3 = z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	757 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	758 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	759 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	760 if (d3) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	761 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	762 /* d1 != 0, d3 != 0, d5 == 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	763 z1 = d7 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	764 z3 = d7 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	765 z5 = MULTIPLY(z3 + d1, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	766
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	767 tmp0 = MULTIPLY(d7, FIX_0_298631336);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	768 tmp2 = MULTIPLY(d3, FIX_3_072711026);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	769 tmp3 = MULTIPLY(d1, FIX_1_501321110);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	770 z1 = MULTIPLY(-z1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	771 z2 = MULTIPLY(-d3, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	772 z3 = MULTIPLY(-z3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	773 z4 = MULTIPLY(-d1, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	774
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	775 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	776 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	777
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	778 tmp0 += z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	779 tmp1 = z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	780 tmp2 += z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	781 tmp3 += z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	782 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	783 /* d1 == 0, d3 != 0, d5 == 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	784 z3 = d7 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	785
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	786 tmp0 = MULTIPLY(-d7, FIX_0_601344887);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	787 z1 = MULTIPLY(-d7, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	788 tmp2 = MULTIPLY(d3, FIX_0_509795579);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	789 z2 = MULTIPLY(-d3, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	790 z5 = MULTIPLY(z3, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	791 z3 = MULTIPLY(-z3, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	792
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	793 tmp0 += z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	794 tmp1 = z2 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	795 tmp2 += z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	796 tmp3 = z1 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	797 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	798 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	799 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	800 /* d1 != 0, d3 == 0, d5 == 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	801 z1 = d7 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	802 z5 = MULTIPLY(z1, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	803
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	804 z1 = MULTIPLY(z1, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	805 z3 = MULTIPLY(-d7, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	806 tmp0 = MULTIPLY(-d7, FIX_1_662939225);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	807 z4 = MULTIPLY(-d1, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	808 tmp3 = MULTIPLY(d1, FIX_1_111140466);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	809
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	810 tmp0 += z1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	811 tmp1 = z4 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	812 tmp2 = z3 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	813 tmp3 += z1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	814 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	815 /* d1 == 0, d3 == 0, d5 == 0, d7 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	816 tmp0 = MULTIPLY(-d7, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	817 tmp1 = MULTIPLY(d7, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	818 tmp2 = MULTIPLY(-d7, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	819 tmp3 = MULTIPLY(d7, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	820 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	821 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	822 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	823 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	824 if (d5) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	825 if (d3) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	826 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	827 /* d1 != 0, d3 != 0, d5 != 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	828 z2 = d5 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	829 z4 = d5 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	830 z5 = MULTIPLY(d3 + z4, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	831
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	832 tmp1 = MULTIPLY(d5, FIX_2_053119869);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	833 tmp2 = MULTIPLY(d3, FIX_3_072711026);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	834 tmp3 = MULTIPLY(d1, FIX_1_501321110);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	835 z1 = MULTIPLY(-d1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	836 z2 = MULTIPLY(-z2, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	837 z3 = MULTIPLY(-d3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	838 z4 = MULTIPLY(-z4, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	839
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	840 z3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	841 z4 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	842
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	843 tmp0 = z1 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	844 tmp1 += z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	845 tmp2 += z2 + z3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	846 tmp3 += z1 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	847 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	848 /* d1 == 0, d3 != 0, d5 != 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	849 z2 = d5 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	850
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	851 z5 = MULTIPLY(z2, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	852 tmp1 = MULTIPLY(d5, FIX_1_662939225);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	853 z4 = MULTIPLY(-d5, FIX_0_390180644);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	854 z2 = MULTIPLY(-z2, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	855 tmp2 = MULTIPLY(d3, FIX_1_111140466);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	856 z3 = MULTIPLY(-d3, FIX_1_961570560);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	857
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	858 tmp0 = z3 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	859 tmp1 += z2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	860 tmp2 += z2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	861 tmp3 = z4 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	862 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	863 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	864 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	865 /* d1 != 0, d3 == 0, d5 != 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	866 z4 = d5 + d1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	867
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	868 z5 = MULTIPLY(z4, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	869 z1 = MULTIPLY(-d1, FIX_0_899976223);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	870 tmp3 = MULTIPLY(d1, FIX_0_601344887);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	871 tmp1 = MULTIPLY(-d5, FIX_0_509795579);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	872 z2 = MULTIPLY(-d5, FIX_2_562915447);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	873 z4 = MULTIPLY(z4, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	874
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	875 tmp0 = z1 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	876 tmp1 += z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	877 tmp2 = z2 + z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	878 tmp3 += z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	879 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	880 /* d1 == 0, d3 == 0, d5 != 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	881 tmp0 = MULTIPLY(d5, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	882 tmp1 = MULTIPLY(d5, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	883 tmp2 = MULTIPLY(-d5, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	884 tmp3 = MULTIPLY(d5, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	885 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	886 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	887 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	888 if (d3) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	889 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	890 /* d1 != 0, d3 != 0, d5 == 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	891 z5 = d1 + d3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	892 tmp3 = MULTIPLY(d1, FIX_0_211164243);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	893 tmp2 = MULTIPLY(-d3, FIX_1_451774981);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	894 z1 = MULTIPLY(d1, FIX_1_061594337);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	895 z2 = MULTIPLY(-d3, FIX_2_172734803);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	896 z4 = MULTIPLY(z5, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	897 z5 = MULTIPLY(z5, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	898
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	899 tmp0 = z1 - z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	900 tmp1 = z2 + z4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	901 tmp2 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	902 tmp3 += z5;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	903 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	904 /* d1 == 0, d3 != 0, d5 == 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	905 tmp0 = MULTIPLY(-d3, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	906 tmp1 = MULTIPLY(-d3, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	907 tmp2 = MULTIPLY(-d3, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	908 tmp3 = MULTIPLY(d3, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	909 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	910 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	911 if (d1) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	912 /* d1 != 0, d3 == 0, d5 == 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	913 tmp0 = MULTIPLY(d1, FIX_0_275899380);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	914 tmp1 = MULTIPLY(d1, FIX_0_785694958);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	915 tmp2 = MULTIPLY(d1, FIX_1_175875602);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	916 tmp3 = MULTIPLY(d1, FIX_1_387039845);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	917 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	918 /* d1 == 0, d3 == 0, d5 == 0, d7 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	919 tmp0 = tmp1 = tmp2 = tmp3 = 0;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	920 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	921 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	922 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	923 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	924
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	925 /* Final output stage: inputs are tmp10..tmp13, tmp0..tmp3 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	926
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	927 dataptr[DCTSIZE*0] = (DCTELEM) DESCALE(tmp10 + tmp3,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	928 CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	929 dataptr[DCTSIZE*7] = (DCTELEM) DESCALE(tmp10 - tmp3,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	930 CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	931 dataptr[DCTSIZE*1] = (DCTELEM) DESCALE(tmp11 + tmp2,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	932 CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	933 dataptr[DCTSIZE*6] = (DCTELEM) DESCALE(tmp11 - tmp2,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	934 CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	935 dataptr[DCTSIZE*2] = (DCTELEM) DESCALE(tmp12 + tmp1,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	936 CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	937 dataptr[DCTSIZE*5] = (DCTELEM) DESCALE(tmp12 - tmp1,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	938 CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	939 dataptr[DCTSIZE*3] = (DCTELEM) DESCALE(tmp13 + tmp0,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	940 CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	941 dataptr[DCTSIZE*4] = (DCTELEM) DESCALE(tmp13 - tmp0,
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	942 CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	943
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	944 dataptr++; /* advance pointer to next column */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	945 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	946 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	947
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	948 #undef DCTSIZE
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	949 #define DCTSIZE 4
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	950 #define DCTSTRIDE 8
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	951
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	952 void j_rev_dct4(DCTBLOCK data)
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	953 {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	954 int32_t tmp0, tmp1, tmp2, tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	955 int32_t tmp10, tmp11, tmp12, tmp13;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	956 int32_t z1;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	957 int32_t d0, d2, d4, d6;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	958 register DCTELEM *dataptr;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	959 int rowctr;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	960
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	961 /* Pass 1: process rows. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	962 /* Note results are scaled up by sqrt(8) compared to a true IDCT; */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	963 /* furthermore, we scale the results by 2*PASS1_BITS. /
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	964
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	965 data[0] += 4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	966
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	967 dataptr = data;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	968
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	969 for (rowctr = DCTSIZE-1; rowctr >= 0; rowctr--) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	970 /* Due to quantization, we will usually find that many of the input
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	971 * coefficients are zero, especially the AC terms. We can exploit this
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	972 * by short-circuiting the IDCT calculation for any row in which all
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	973 * the AC terms are zero. In that case each output is equal to the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	974 * DC coefficient (with scale factor as needed).
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	975 * With typical images and quantization tables, half or more of the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	976 * row DCT calculations can be simplified this way.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	977 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	978
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	979 register int idataptr = (int)dataptr;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	980
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	981 d0 = dataptr[0];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	982 d2 = dataptr[1];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	983 d4 = dataptr[2];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	984 d6 = dataptr[3];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	985
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	986 if ((d2 \| d4 \| d6) == 0) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	987 /* AC terms all zero */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	988 if (d0) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	989 /* Compute a 32 bit value to assign. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	990 DCTELEM dcval = (DCTELEM) (d0 << PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	991 register int v = (dcval & 0xffff) \| ((dcval << 16) & 0xffff0000);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	992
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	993 idataptr[0] = v;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	994 idataptr[1] = v;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	995 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	996
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	997 dataptr += DCTSTRIDE; /* advance pointer to next row */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	998 continue;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	999 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1000
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1001 /* Even part: reverse the even part of the forward DCT. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1002 /* The rotator is sqrt(2)c(-6). /
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1003 if (d6) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1004 if (d2) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1005 /* d0 != 0, d2 != 0, d4 != 0, d6 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1006 z1 = MULTIPLY(d2 + d6, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1007 tmp2 = z1 + MULTIPLY(-d6, FIX_1_847759065);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1008 tmp3 = z1 + MULTIPLY(d2, FIX_0_765366865);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1009
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1010 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1011 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1012
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1013 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1014 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1015 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1016 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1017 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1018 /* d0 != 0, d2 == 0, d4 != 0, d6 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1019 tmp2 = MULTIPLY(-d6, FIX_1_306562965);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1020 tmp3 = MULTIPLY(d6, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1021
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1022 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1023 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1024
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1025 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1026 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1027 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1028 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1029 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1030 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1031 if (d2) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1032 /* d0 != 0, d2 != 0, d4 != 0, d6 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1033 tmp2 = MULTIPLY(d2, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1034 tmp3 = MULTIPLY(d2, FIX_1_306562965);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1035
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1036 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1037 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1038
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1039 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1040 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1041 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1042 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1043 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1044 /* d0 != 0, d2 == 0, d4 != 0, d6 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1045 tmp10 = tmp13 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1046 tmp11 = tmp12 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1047 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1048 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1049
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1050 /* Final output stage: inputs are tmp10..tmp13, tmp0..tmp3 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1051
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1052 dataptr[0] = (DCTELEM) DESCALE(tmp10, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1053 dataptr[1] = (DCTELEM) DESCALE(tmp11, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1054 dataptr[2] = (DCTELEM) DESCALE(tmp12, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1055 dataptr[3] = (DCTELEM) DESCALE(tmp13, CONST_BITS-PASS1_BITS);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1056
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1057 dataptr += DCTSTRIDE; /* advance pointer to next row */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1058 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1059
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1060 /* Pass 2: process columns. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1061 /* Note that we must descale the results by a factor of 8 == 2*3, /
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1062 /* and also undo the PASS1_BITS scaling. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1063
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1064 dataptr = data;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1065 for (rowctr = DCTSIZE-1; rowctr >= 0; rowctr--) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1066 /* Columns of zeroes can be exploited in the same way as we did with rows.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1067 * However, the row calculation has created many nonzero AC terms, so the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1068 * simplification applies less often (typically 5% to 10% of the time).
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1069 * On machines with very fast multiplication, it's possible that the
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1070 * test takes more time than it's worth. In that case this section
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1071 * may be commented out.
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1072 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1073
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1074 d0 = dataptr[DCTSTRIDE*0];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1075 d2 = dataptr[DCTSTRIDE*1];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1076 d4 = dataptr[DCTSTRIDE*2];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1077 d6 = dataptr[DCTSTRIDE*3];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1078
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1079 /* Even part: reverse the even part of the forward DCT. */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1080 /* The rotator is sqrt(2)c(-6). /
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1081 if (d6) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1082 if (d2) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1083 /* d0 != 0, d2 != 0, d4 != 0, d6 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1084 z1 = MULTIPLY(d2 + d6, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1085 tmp2 = z1 + MULTIPLY(-d6, FIX_1_847759065);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1086 tmp3 = z1 + MULTIPLY(d2, FIX_0_765366865);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1087
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1088 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1089 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1090
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1091 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1092 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1093 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1094 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1095 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1096 /* d0 != 0, d2 == 0, d4 != 0, d6 != 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1097 tmp2 = MULTIPLY(-d6, FIX_1_306562965);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1098 tmp3 = MULTIPLY(d6, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1099
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1100 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1101 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1102
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1103 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1104 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1105 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1106 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1107 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1108 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1109 if (d2) {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1110 /* d0 != 0, d2 != 0, d4 != 0, d6 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1111 tmp2 = MULTIPLY(d2, FIX_0_541196100);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1112 tmp3 = MULTIPLY(d2, FIX_1_306562965);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1113
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1114 tmp0 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1115 tmp1 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1116
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1117 tmp10 = tmp0 + tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1118 tmp13 = tmp0 - tmp3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1119 tmp11 = tmp1 + tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1120 tmp12 = tmp1 - tmp2;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1121 } else {
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1122 /* d0 != 0, d2 == 0, d4 != 0, d6 == 0 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1123 tmp10 = tmp13 = (d0 + d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1124 tmp11 = tmp12 = (d0 - d4) << CONST_BITS;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1125 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1126 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1127
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1128 /* Final output stage: inputs are tmp10..tmp13, tmp0..tmp3 */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1129
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1130 dataptr[DCTSTRIDE*0] = tmp10 >> (CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1131 dataptr[DCTSTRIDE*1] = tmp11 >> (CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1132 dataptr[DCTSTRIDE*2] = tmp12 >> (CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1133 dataptr[DCTSTRIDE*3] = tmp13 >> (CONST_BITS+PASS1_BITS+3);
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1134
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1135 dataptr++; /* advance pointer to next column */
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1136 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1137 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1138
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1139 void j_rev_dct2(DCTBLOCK data){
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1140 int d00, d01, d10, d11;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1141
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1142 data[0] += 4;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1143 d00 = data[0+0DCTSTRIDE] + data[1+0DCTSTRIDE];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1144 d01 = data[0+0DCTSTRIDE] - data[1+0DCTSTRIDE];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1145 d10 = data[0+1DCTSTRIDE] + data[1+1DCTSTRIDE];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1146 d11 = data[0+1DCTSTRIDE] - data[1+1DCTSTRIDE];
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1147
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1148 data[0+0*DCTSTRIDE]= (d00 + d10)>>3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1149 data[1+0*DCTSTRIDE]= (d01 + d11)>>3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1150 data[0+1*DCTSTRIDE]= (d00 - d10)>>3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1151 data[1+1*DCTSTRIDE]= (d01 - d11)>>3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1152 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1153
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1154 void j_rev_dct1(DCTBLOCK data){
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1155 data[0] = (data[0] + 4)>>3;
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1156 }
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1157
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1158 #undef FIX
e8776388b02a [svn] - add ffmpeg nenolod parents: diff changeset	1159 #undef CONST_BITS

Mercurial > audlegacy-plugins

annotate src/ffmpeg/libavcodec/jrevdct.c @ 811:3afe5701df41 trunk