mirror of
https://github.com/Motorhead1991/qemu.git
synced 2025-08-03 15:53:54 -06:00
target/arm: Convert FRECPE, FRECPX, FRSQRTE to decodetree
Remove disas_simd_scalar_two_reg_misc and disas_simd_two_reg_misc_fp16 as these were the last insns decoded by those functions. Reviewed-by: Peter Maydell <peter.maydell@linaro.org> Signed-off-by: Richard Henderson <richard.henderson@linaro.org> Message-id: 20241211163036.2297116-67-richard.henderson@linaro.org Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
This commit is contained in:
parent
df112a2578
commit
31e65acf7b
2 changed files with 53 additions and 291 deletions
|
@ -1667,6 +1667,15 @@ FCMLE0_s 0111 1110 1.1 00000 11011 0 ..... ..... @rr_sd
|
|||
FCMLT0_s 0101 1110 111 11000 11101 0 ..... ..... @rr_h
|
||||
FCMLT0_s 0101 1110 1.1 00000 11101 0 ..... ..... @rr_sd
|
||||
|
||||
FRECPE_s 0101 1110 111 11001 11011 0 ..... ..... @rr_h
|
||||
FRECPE_s 0101 1110 1.1 00001 11011 0 ..... ..... @rr_sd
|
||||
|
||||
FRECPX_s 0101 1110 111 11001 11111 0 ..... ..... @rr_h
|
||||
FRECPX_s 0101 1110 1.1 00001 11111 0 ..... ..... @rr_sd
|
||||
|
||||
FRSQRTE_s 0111 1110 111 11001 11011 0 ..... ..... @rr_h
|
||||
FRSQRTE_s 0111 1110 1.1 00001 11011 0 ..... ..... @rr_sd
|
||||
|
||||
@icvt_h . ....... .. ...... ...... rn:5 rd:5 \
|
||||
&fcvt sf=0 esz=1 shift=0
|
||||
@icvt_sd . ....... .. ...... ...... rn:5 rd:5 \
|
||||
|
@ -1848,6 +1857,12 @@ FCMLE0_v 0.10 1110 1.1 00000 11011 0 ..... ..... @qrr_sd
|
|||
FCMLT0_v 0.00 1110 111 11000 11101 0 ..... ..... @qrr_h
|
||||
FCMLT0_v 0.00 1110 1.1 00000 11101 0 ..... ..... @qrr_sd
|
||||
|
||||
FRECPE_v 0.00 1110 111 11001 11011 0 ..... ..... @qrr_h
|
||||
FRECPE_v 0.00 1110 1.1 00001 11011 0 ..... ..... @qrr_sd
|
||||
|
||||
FRSQRTE_v 0.10 1110 111 11001 11011 0 ..... ..... @qrr_h
|
||||
FRSQRTE_v 0.10 1110 1.1 00001 11011 0 ..... ..... @qrr_sd
|
||||
|
||||
&fcvt_q rd rn esz q shift
|
||||
@fcvtq_h . q:1 . ...... 001 .... ...... rn:5 rd:5 \
|
||||
&fcvt_q esz=1 shift=%fcvt_f_sh_h
|
||||
|
|
|
@ -8501,6 +8501,27 @@ TRANS_FEAT(FRINT64Z_s, aa64_frint, do_fp1_scalar, a,
|
|||
&f_scalar_frint64, FPROUNDING_ZERO)
|
||||
TRANS_FEAT(FRINT64X_s, aa64_frint, do_fp1_scalar, a, &f_scalar_frint64, -1)
|
||||
|
||||
static const FPScalar1 f_scalar_frecpe = {
|
||||
gen_helper_recpe_f16,
|
||||
gen_helper_recpe_f32,
|
||||
gen_helper_recpe_f64,
|
||||
};
|
||||
TRANS(FRECPE_s, do_fp1_scalar, a, &f_scalar_frecpe, -1)
|
||||
|
||||
static const FPScalar1 f_scalar_frecpx = {
|
||||
gen_helper_frecpx_f16,
|
||||
gen_helper_frecpx_f32,
|
||||
gen_helper_frecpx_f64,
|
||||
};
|
||||
TRANS(FRECPX_s, do_fp1_scalar, a, &f_scalar_frecpx, -1)
|
||||
|
||||
static const FPScalar1 f_scalar_frsqrte = {
|
||||
gen_helper_rsqrte_f16,
|
||||
gen_helper_rsqrte_f32,
|
||||
gen_helper_rsqrte_f64,
|
||||
};
|
||||
TRANS(FRSQRTE_s, do_fp1_scalar, a, &f_scalar_frsqrte, -1)
|
||||
|
||||
static bool trans_FCVT_s_ds(DisasContext *s, arg_rr *a)
|
||||
{
|
||||
if (fp_access_check(s)) {
|
||||
|
@ -9471,36 +9492,28 @@ static gen_helper_gvec_2_ptr * const f_fcle0[] = {
|
|||
};
|
||||
TRANS(FCMLE0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fcle0)
|
||||
|
||||
static gen_helper_gvec_2_ptr * const f_frecpe[] = {
|
||||
gen_helper_gvec_frecpe_h,
|
||||
gen_helper_gvec_frecpe_s,
|
||||
gen_helper_gvec_frecpe_d,
|
||||
};
|
||||
TRANS(FRECPE_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_frecpe)
|
||||
|
||||
static gen_helper_gvec_2_ptr * const f_frsqrte[] = {
|
||||
gen_helper_gvec_frsqrte_h,
|
||||
gen_helper_gvec_frsqrte_s,
|
||||
gen_helper_gvec_frsqrte_d,
|
||||
};
|
||||
TRANS(FRSQRTE_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_frsqrte)
|
||||
|
||||
static void handle_2misc_reciprocal(DisasContext *s, int opcode,
|
||||
bool is_scalar, bool is_u, bool is_q,
|
||||
int size, int rn, int rd)
|
||||
{
|
||||
bool is_double = (size == 3);
|
||||
TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
|
||||
|
||||
if (is_double) {
|
||||
TCGv_i64 tcg_op = tcg_temp_new_i64();
|
||||
TCGv_i64 tcg_res = tcg_temp_new_i64();
|
||||
int pass;
|
||||
|
||||
for (pass = 0; pass < (is_scalar ? 1 : 2); pass++) {
|
||||
read_vec_element(s, tcg_op, rn, pass, MO_64);
|
||||
switch (opcode) {
|
||||
case 0x3d: /* FRECPE */
|
||||
gen_helper_recpe_f64(tcg_res, tcg_op, fpst);
|
||||
break;
|
||||
case 0x3f: /* FRECPX */
|
||||
gen_helper_frecpx_f64(tcg_res, tcg_op, fpst);
|
||||
break;
|
||||
case 0x7d: /* FRSQRTE */
|
||||
gen_helper_rsqrte_f64(tcg_res, tcg_op, fpst);
|
||||
break;
|
||||
default:
|
||||
g_assert_not_reached();
|
||||
}
|
||||
write_vec_element(s, tcg_res, rd, pass, MO_64);
|
||||
}
|
||||
clear_vec_high(s, !is_scalar, rd);
|
||||
g_assert_not_reached();
|
||||
} else {
|
||||
TCGv_i32 tcg_op = tcg_temp_new_i32();
|
||||
TCGv_i32 tcg_res = tcg_temp_new_i32();
|
||||
|
@ -9520,14 +9533,8 @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
|
|||
gen_helper_recpe_u32(tcg_res, tcg_op);
|
||||
break;
|
||||
case 0x3d: /* FRECPE */
|
||||
gen_helper_recpe_f32(tcg_res, tcg_op, fpst);
|
||||
break;
|
||||
case 0x3f: /* FRECPX */
|
||||
gen_helper_frecpx_f32(tcg_res, tcg_op, fpst);
|
||||
break;
|
||||
case 0x7d: /* FRSQRTE */
|
||||
gen_helper_rsqrte_f32(tcg_res, tcg_op, fpst);
|
||||
break;
|
||||
default:
|
||||
g_assert_not_reached();
|
||||
}
|
||||
|
@ -9544,76 +9551,6 @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
|
|||
}
|
||||
}
|
||||
|
||||
/* AdvSIMD scalar two reg misc
|
||||
* 31 30 29 28 24 23 22 21 17 16 12 11 10 9 5 4 0
|
||||
* +-----+---+-----------+------+-----------+--------+-----+------+------+
|
||||
* | 0 1 | U | 1 1 1 1 0 | size | 1 0 0 0 0 | opcode | 1 0 | Rn | Rd |
|
||||
* +-----+---+-----------+------+-----------+--------+-----+------+------+
|
||||
*/
|
||||
static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
|
||||
{
|
||||
int rd = extract32(insn, 0, 5);
|
||||
int rn = extract32(insn, 5, 5);
|
||||
int opcode = extract32(insn, 12, 5);
|
||||
int size = extract32(insn, 22, 2);
|
||||
bool u = extract32(insn, 29, 1);
|
||||
|
||||
switch (opcode) {
|
||||
case 0xc ... 0xf:
|
||||
case 0x16 ... 0x1d:
|
||||
case 0x1f:
|
||||
/* Floating point: U, size[1] and opcode indicate operation;
|
||||
* size[0] indicates single or double precision.
|
||||
*/
|
||||
opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
|
||||
size = extract32(size, 0, 1) ? 3 : 2;
|
||||
switch (opcode) {
|
||||
case 0x3d: /* FRECPE */
|
||||
case 0x3f: /* FRECPX */
|
||||
case 0x7d: /* FRSQRTE */
|
||||
if (!fp_access_check(s)) {
|
||||
return;
|
||||
}
|
||||
handle_2misc_reciprocal(s, opcode, true, u, true, size, rn, rd);
|
||||
return;
|
||||
case 0x1a: /* FCVTNS */
|
||||
case 0x1b: /* FCVTMS */
|
||||
case 0x3a: /* FCVTPS */
|
||||
case 0x3b: /* FCVTZS */
|
||||
case 0x5a: /* FCVTNU */
|
||||
case 0x5b: /* FCVTMU */
|
||||
case 0x7a: /* FCVTPU */
|
||||
case 0x7b: /* FCVTZU */
|
||||
case 0x1c: /* FCVTAS */
|
||||
case 0x5c: /* FCVTAU */
|
||||
case 0x56: /* FCVTXN, FCVTXN2 */
|
||||
case 0x1d: /* SCVTF */
|
||||
case 0x5d: /* UCVTF */
|
||||
case 0x2c: /* FCMGT (zero) */
|
||||
case 0x2d: /* FCMEQ (zero) */
|
||||
case 0x2e: /* FCMLT (zero) */
|
||||
case 0x6c: /* FCMGE (zero) */
|
||||
case 0x6d: /* FCMLE (zero) */
|
||||
default:
|
||||
unallocated_encoding(s);
|
||||
return;
|
||||
}
|
||||
break;
|
||||
default:
|
||||
case 0x3: /* USQADD / SUQADD */
|
||||
case 0x7: /* SQABS / SQNEG */
|
||||
case 0x8: /* CMGT, CMGE */
|
||||
case 0x9: /* CMEQ, CMLE */
|
||||
case 0xa: /* CMLT */
|
||||
case 0xb: /* ABS, NEG */
|
||||
case 0x12: /* SQXTUN */
|
||||
case 0x14: /* SQXTN, UQXTN */
|
||||
unallocated_encoding(s);
|
||||
return;
|
||||
}
|
||||
g_assert_not_reached();
|
||||
}
|
||||
|
||||
static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
|
||||
int size, int rn, int rd)
|
||||
{
|
||||
|
@ -9693,13 +9630,6 @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
|
|||
unallocated_encoding(s);
|
||||
return;
|
||||
}
|
||||
/* fall through */
|
||||
case 0x3d: /* FRECPE */
|
||||
case 0x7d: /* FRSQRTE */
|
||||
if (size == 3 && !is_q) {
|
||||
unallocated_encoding(s);
|
||||
return;
|
||||
}
|
||||
if (!fp_access_check(s)) {
|
||||
return;
|
||||
}
|
||||
|
@ -9752,6 +9682,8 @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
|
|||
case 0x2e: /* FCMLT (zero) */
|
||||
case 0x6c: /* FCMGE (zero) */
|
||||
case 0x6d: /* FCMLE (zero) */
|
||||
case 0x3d: /* FRECPE */
|
||||
case 0x7d: /* FRSQRTE */
|
||||
unallocated_encoding(s);
|
||||
return;
|
||||
}
|
||||
|
@ -9847,189 +9779,6 @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
|
|||
}
|
||||
}
|
||||
|
||||
/* AdvSIMD [scalar] two register miscellaneous (FP16)
|
||||
*
|
||||
* 31 30 29 28 27 24 23 22 21 17 16 12 11 10 9 5 4 0
|
||||
* +---+---+---+---+---------+---+-------------+--------+-----+------+------+
|
||||
* | 0 | Q | U | S | 1 1 1 0 | a | 1 1 1 1 0 0 | opcode | 1 0 | Rn | Rd |
|
||||
* +---+---+---+---+---------+---+-------------+--------+-----+------+------+
|
||||
* mask: 1000 1111 0111 1110 0000 1100 0000 0000 0x8f7e 0c00
|
||||
* val: 0000 1110 0111 1000 0000 1000 0000 0000 0x0e78 0800
|
||||
*
|
||||
* This actually covers two groups where scalar access is governed by
|
||||
* bit 28. A bunch of the instructions (float to integral) only exist
|
||||
* in the vector form and are un-allocated for the scalar decode. Also
|
||||
* in the scalar decode Q is always 1.
|
||||
*/
|
||||
static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
|
||||
{
|
||||
int fpop, opcode, a, u;
|
||||
int rn, rd;
|
||||
bool is_q;
|
||||
bool is_scalar;
|
||||
|
||||
int pass;
|
||||
TCGv_i32 tcg_rmode = NULL;
|
||||
TCGv_ptr tcg_fpstatus = NULL;
|
||||
bool need_fpst = true;
|
||||
int rmode = -1;
|
||||
|
||||
if (!dc_isar_feature(aa64_fp16, s)) {
|
||||
unallocated_encoding(s);
|
||||
return;
|
||||
}
|
||||
|
||||
rd = extract32(insn, 0, 5);
|
||||
rn = extract32(insn, 5, 5);
|
||||
|
||||
a = extract32(insn, 23, 1);
|
||||
u = extract32(insn, 29, 1);
|
||||
is_scalar = extract32(insn, 28, 1);
|
||||
is_q = extract32(insn, 30, 1);
|
||||
|
||||
opcode = extract32(insn, 12, 5);
|
||||
fpop = deposit32(opcode, 5, 1, a);
|
||||
fpop = deposit32(fpop, 6, 1, u);
|
||||
|
||||
switch (fpop) {
|
||||
case 0x3d: /* FRECPE */
|
||||
case 0x3f: /* FRECPX */
|
||||
break;
|
||||
case 0x7d: /* FRSQRTE */
|
||||
break;
|
||||
default:
|
||||
case 0x2f: /* FABS */
|
||||
case 0x6f: /* FNEG */
|
||||
case 0x7f: /* FSQRT (vector) */
|
||||
case 0x18: /* FRINTN */
|
||||
case 0x19: /* FRINTM */
|
||||
case 0x38: /* FRINTP */
|
||||
case 0x39: /* FRINTZ */
|
||||
case 0x58: /* FRINTA */
|
||||
case 0x59: /* FRINTX */
|
||||
case 0x79: /* FRINTI */
|
||||
case 0x1d: /* SCVTF */
|
||||
case 0x5d: /* UCVTF */
|
||||
case 0x1a: /* FCVTNS */
|
||||
case 0x1b: /* FCVTMS */
|
||||
case 0x1c: /* FCVTAS */
|
||||
case 0x3a: /* FCVTPS */
|
||||
case 0x3b: /* FCVTZS */
|
||||
case 0x5a: /* FCVTNU */
|
||||
case 0x5b: /* FCVTMU */
|
||||
case 0x5c: /* FCVTAU */
|
||||
case 0x7a: /* FCVTPU */
|
||||
case 0x7b: /* FCVTZU */
|
||||
case 0x2c: /* FCMGT (zero) */
|
||||
case 0x2d: /* FCMEQ (zero) */
|
||||
case 0x2e: /* FCMLT (zero) */
|
||||
case 0x6c: /* FCMGE (zero) */
|
||||
case 0x6d: /* FCMLE (zero) */
|
||||
unallocated_encoding(s);
|
||||
return;
|
||||
}
|
||||
|
||||
|
||||
/* Check additional constraints for the scalar encoding */
|
||||
if (is_scalar) {
|
||||
if (!is_q) {
|
||||
unallocated_encoding(s);
|
||||
return;
|
||||
}
|
||||
}
|
||||
|
||||
if (!fp_access_check(s)) {
|
||||
return;
|
||||
}
|
||||
|
||||
if (rmode >= 0 || need_fpst) {
|
||||
tcg_fpstatus = fpstatus_ptr(FPST_FPCR_F16);
|
||||
}
|
||||
|
||||
if (rmode >= 0) {
|
||||
tcg_rmode = gen_set_rmode(rmode, tcg_fpstatus);
|
||||
}
|
||||
|
||||
if (is_scalar) {
|
||||
TCGv_i32 tcg_op = read_fp_hreg(s, rn);
|
||||
TCGv_i32 tcg_res = tcg_temp_new_i32();
|
||||
|
||||
switch (fpop) {
|
||||
case 0x3d: /* FRECPE */
|
||||
gen_helper_recpe_f16(tcg_res, tcg_op, tcg_fpstatus);
|
||||
break;
|
||||
case 0x3f: /* FRECPX */
|
||||
gen_helper_frecpx_f16(tcg_res, tcg_op, tcg_fpstatus);
|
||||
break;
|
||||
case 0x7d: /* FRSQRTE */
|
||||
gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
|
||||
break;
|
||||
default:
|
||||
case 0x1a: /* FCVTNS */
|
||||
case 0x1b: /* FCVTMS */
|
||||
case 0x1c: /* FCVTAS */
|
||||
case 0x3a: /* FCVTPS */
|
||||
case 0x3b: /* FCVTZS */
|
||||
case 0x5a: /* FCVTNU */
|
||||
case 0x5b: /* FCVTMU */
|
||||
case 0x5c: /* FCVTAU */
|
||||
case 0x7a: /* FCVTPU */
|
||||
case 0x7b: /* FCVTZU */
|
||||
g_assert_not_reached();
|
||||
}
|
||||
|
||||
/* limit any sign extension going on */
|
||||
tcg_gen_andi_i32(tcg_res, tcg_res, 0xffff);
|
||||
write_fp_sreg(s, rd, tcg_res);
|
||||
} else {
|
||||
for (pass = 0; pass < (is_q ? 8 : 4); pass++) {
|
||||
TCGv_i32 tcg_op = tcg_temp_new_i32();
|
||||
TCGv_i32 tcg_res = tcg_temp_new_i32();
|
||||
|
||||
read_vec_element_i32(s, tcg_op, rn, pass, MO_16);
|
||||
|
||||
switch (fpop) {
|
||||
case 0x3d: /* FRECPE */
|
||||
gen_helper_recpe_f16(tcg_res, tcg_op, tcg_fpstatus);
|
||||
break;
|
||||
case 0x7d: /* FRSQRTE */
|
||||
gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
|
||||
break;
|
||||
default:
|
||||
case 0x2f: /* FABS */
|
||||
case 0x6f: /* FNEG */
|
||||
case 0x7f: /* FSQRT */
|
||||
case 0x18: /* FRINTN */
|
||||
case 0x19: /* FRINTM */
|
||||
case 0x38: /* FRINTP */
|
||||
case 0x39: /* FRINTZ */
|
||||
case 0x58: /* FRINTA */
|
||||
case 0x79: /* FRINTI */
|
||||
case 0x59: /* FRINTX */
|
||||
case 0x1a: /* FCVTNS */
|
||||
case 0x1b: /* FCVTMS */
|
||||
case 0x1c: /* FCVTAS */
|
||||
case 0x3a: /* FCVTPS */
|
||||
case 0x3b: /* FCVTZS */
|
||||
case 0x5a: /* FCVTNU */
|
||||
case 0x5b: /* FCVTMU */
|
||||
case 0x5c: /* FCVTAU */
|
||||
case 0x7a: /* FCVTPU */
|
||||
case 0x7b: /* FCVTZU */
|
||||
g_assert_not_reached();
|
||||
}
|
||||
|
||||
write_vec_element_i32(s, tcg_res, rd, pass, MO_16);
|
||||
}
|
||||
|
||||
clear_vec_high(s, is_q, rd);
|
||||
}
|
||||
|
||||
if (tcg_rmode) {
|
||||
gen_restore_rmode(tcg_rmode, tcg_fpstatus);
|
||||
}
|
||||
}
|
||||
|
||||
/* C3.6 Data processing - SIMD, inc Crypto
|
||||
*
|
||||
* As the decode gets a little complex we are using a table based
|
||||
|
@ -10038,8 +9787,6 @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
|
|||
static const AArch64DecodeTable data_proc_simd[] = {
|
||||
/* pattern , mask , fn */
|
||||
{ 0x0e200800, 0x9f3e0c00, disas_simd_two_reg_misc },
|
||||
{ 0x5e200800, 0xdf3e0c00, disas_simd_scalar_two_reg_misc },
|
||||
{ 0x0e780800, 0x8f7e0c00, disas_simd_two_reg_misc_fp16 },
|
||||
{ 0x00000000, 0x00000000, NULL }
|
||||
};
|
||||
|
||||
|
|
Loading…
Add table
Add a link
Reference in a new issue