mirror of
https://github.com/dolphin-emu/dolphin.git
synced 2025-07-25 15:19:42 -06:00
Merge pull request #4395 from degasus/master
JitArm64: Implement 4 ppc instructions.
This commit is contained in:
@ -651,6 +651,11 @@ public:
|
|||||||
ARM64Reg zr = Is64Bit(Rd) ? ZR : WZR;
|
ARM64Reg zr = Is64Bit(Rd) ? ZR : WZR;
|
||||||
CSINC(Rd, zr, zr, (CCFlags)((u32)cond ^ 1));
|
CSINC(Rd, zr, zr, (CCFlags)((u32)cond ^ 1));
|
||||||
}
|
}
|
||||||
|
void CSETM(ARM64Reg Rd, CCFlags cond)
|
||||||
|
{
|
||||||
|
ARM64Reg zr = Is64Bit(Rd) ? ZR : WZR;
|
||||||
|
CSINV(Rd, zr, zr, (CCFlags)((u32)cond ^ 1));
|
||||||
|
}
|
||||||
void NEG(ARM64Reg Rd, ARM64Reg Rs) { SUB(Rd, Is64Bit(Rd) ? ZR : WZR, Rs); }
|
void NEG(ARM64Reg Rd, ARM64Reg Rs) { SUB(Rd, Is64Bit(Rd) ? ZR : WZR, Rs); }
|
||||||
// Data-Processing 1 source
|
// Data-Processing 1 source
|
||||||
void RBIT(ARM64Reg Rd, ARM64Reg Rn);
|
void RBIT(ARM64Reg Rd, ARM64Reg Rn);
|
||||||
|
@ -81,12 +81,15 @@ public:
|
|||||||
void addic(UGeckoInstruction inst);
|
void addic(UGeckoInstruction inst);
|
||||||
void mulli(UGeckoInstruction inst);
|
void mulli(UGeckoInstruction inst);
|
||||||
void addzex(UGeckoInstruction inst);
|
void addzex(UGeckoInstruction inst);
|
||||||
|
void divwx(UGeckoInstruction inst);
|
||||||
void subfx(UGeckoInstruction inst);
|
void subfx(UGeckoInstruction inst);
|
||||||
void addcx(UGeckoInstruction inst);
|
void addcx(UGeckoInstruction inst);
|
||||||
void slwx(UGeckoInstruction inst);
|
void slwx(UGeckoInstruction inst);
|
||||||
void srwx(UGeckoInstruction inst);
|
void srwx(UGeckoInstruction inst);
|
||||||
|
void srawx(UGeckoInstruction inst);
|
||||||
void rlwimix(UGeckoInstruction inst);
|
void rlwimix(UGeckoInstruction inst);
|
||||||
void subfex(UGeckoInstruction inst);
|
void subfex(UGeckoInstruction inst);
|
||||||
|
void subfzex(UGeckoInstruction inst);
|
||||||
void subfcx(UGeckoInstruction inst);
|
void subfcx(UGeckoInstruction inst);
|
||||||
void subfic(UGeckoInstruction inst);
|
void subfic(UGeckoInstruction inst);
|
||||||
void addex(UGeckoInstruction inst);
|
void addex(UGeckoInstruction inst);
|
||||||
@ -96,6 +99,7 @@ public:
|
|||||||
void mtmsr(UGeckoInstruction inst);
|
void mtmsr(UGeckoInstruction inst);
|
||||||
void mfmsr(UGeckoInstruction inst);
|
void mfmsr(UGeckoInstruction inst);
|
||||||
void mcrf(UGeckoInstruction inst);
|
void mcrf(UGeckoInstruction inst);
|
||||||
|
void mcrxr(UGeckoInstruction inst);
|
||||||
void mfsr(UGeckoInstruction inst);
|
void mfsr(UGeckoInstruction inst);
|
||||||
void mtsr(UGeckoInstruction inst);
|
void mtsr(UGeckoInstruction inst);
|
||||||
void mfsrin(UGeckoInstruction inst);
|
void mfsrin(UGeckoInstruction inst);
|
||||||
|
@ -869,6 +869,28 @@ void JitArm64::subfcx(UGeckoInstruction inst)
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
void JitArm64::subfzex(UGeckoInstruction inst)
|
||||||
|
{
|
||||||
|
INSTRUCTION_START
|
||||||
|
JITDISABLE(bJITIntegerOff);
|
||||||
|
FALLBACK_IF(inst.OE);
|
||||||
|
|
||||||
|
int a = inst.RA, d = inst.RD;
|
||||||
|
|
||||||
|
gpr.BindToRegister(d, d == a);
|
||||||
|
|
||||||
|
ARM64Reg WA = gpr.GetReg();
|
||||||
|
LDRB(INDEX_UNSIGNED, WA, PPC_REG, PPCSTATE_OFF(xer_ca));
|
||||||
|
MVN(gpr.R(d), gpr.R(a));
|
||||||
|
ADDS(gpr.R(d), gpr.R(d), WA);
|
||||||
|
gpr.Unlock(WA);
|
||||||
|
|
||||||
|
ComputeCarry();
|
||||||
|
|
||||||
|
if (inst.Rc)
|
||||||
|
ComputeRC(gpr.R(d));
|
||||||
|
}
|
||||||
|
|
||||||
void JitArm64::subfic(UGeckoInstruction inst)
|
void JitArm64::subfic(UGeckoInstruction inst)
|
||||||
{
|
{
|
||||||
INSTRUCTION_START
|
INSTRUCTION_START
|
||||||
@ -1009,6 +1031,79 @@ void JitArm64::divwux(UGeckoInstruction inst)
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
void JitArm64::divwx(UGeckoInstruction inst)
|
||||||
|
{
|
||||||
|
INSTRUCTION_START
|
||||||
|
JITDISABLE(bJITIntegerOff);
|
||||||
|
FALLBACK_IF(inst.OE);
|
||||||
|
|
||||||
|
int a = inst.RA, b = inst.RB, d = inst.RD;
|
||||||
|
|
||||||
|
if (gpr.IsImm(a) && gpr.IsImm(b))
|
||||||
|
{
|
||||||
|
s32 imm_a = gpr.GetImm(a);
|
||||||
|
s32 imm_b = gpr.GetImm(b);
|
||||||
|
s32 imm_d;
|
||||||
|
if (imm_b == 0 || ((u32)imm_a == 0x80000000 && imm_b == -1))
|
||||||
|
{
|
||||||
|
if (((u32)imm_a & 0x80000000) && imm_b == 0)
|
||||||
|
imm_d = -1;
|
||||||
|
else
|
||||||
|
imm_d = 0;
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
imm_d = (u32)(imm_a / imm_b);
|
||||||
|
}
|
||||||
|
gpr.SetImmediate(d, imm_d);
|
||||||
|
|
||||||
|
if (inst.Rc)
|
||||||
|
ComputeRC(imm_d);
|
||||||
|
}
|
||||||
|
else if (gpr.IsImm(b) && gpr.GetImm(b) != 0 && gpr.GetImm(b) != -1)
|
||||||
|
{
|
||||||
|
ARM64Reg WA = gpr.GetReg();
|
||||||
|
MOVI2R(WA, gpr.GetImm(b));
|
||||||
|
|
||||||
|
gpr.BindToRegister(d, d == a);
|
||||||
|
|
||||||
|
SDIV(gpr.R(d), gpr.R(a), WA);
|
||||||
|
|
||||||
|
gpr.Unlock(WA);
|
||||||
|
|
||||||
|
if (inst.Rc)
|
||||||
|
ComputeRC(gpr.R(d));
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
gpr.BindToRegister(d, d == a || d == b);
|
||||||
|
|
||||||
|
ARM64Reg WA = gpr.GetReg();
|
||||||
|
|
||||||
|
FixupBranch slow1 = CBZ(gpr.R(b));
|
||||||
|
MOVI2R(WA, -0x80000000LL);
|
||||||
|
CMP(gpr.R(a), WA);
|
||||||
|
CCMN(gpr.R(b), 1, 0, CC_EQ);
|
||||||
|
FixupBranch slow2 = B(CC_EQ);
|
||||||
|
SDIV(gpr.R(d), gpr.R(a), gpr.R(b));
|
||||||
|
FixupBranch done = B();
|
||||||
|
|
||||||
|
SetJumpTarget(slow1);
|
||||||
|
SetJumpTarget(slow2);
|
||||||
|
|
||||||
|
CMP(gpr.R(b), 0);
|
||||||
|
CCMP(gpr.R(a), 0, 0, CC_EQ);
|
||||||
|
CSETM(gpr.R(d), CC_LT);
|
||||||
|
|
||||||
|
SetJumpTarget(done);
|
||||||
|
|
||||||
|
gpr.Unlock(WA);
|
||||||
|
|
||||||
|
if (inst.Rc)
|
||||||
|
ComputeRC(gpr.R(d));
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
void JitArm64::slwx(UGeckoInstruction inst)
|
void JitArm64::slwx(UGeckoInstruction inst)
|
||||||
{
|
{
|
||||||
INSTRUCTION_START
|
INSTRUCTION_START
|
||||||
@ -1104,6 +1199,92 @@ void JitArm64::srwx(UGeckoInstruction inst)
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
void JitArm64::srawx(UGeckoInstruction inst)
|
||||||
|
{
|
||||||
|
INSTRUCTION_START
|
||||||
|
JITDISABLE(bJITIntegerOff);
|
||||||
|
|
||||||
|
int a = inst.RA, b = inst.RB, s = inst.RS;
|
||||||
|
|
||||||
|
if (gpr.IsImm(b) && gpr.IsImm(s))
|
||||||
|
{
|
||||||
|
s32 i = gpr.GetImm(s), amount = gpr.GetImm(b);
|
||||||
|
if (amount & 0x20)
|
||||||
|
{
|
||||||
|
gpr.SetImmediate(a, i & 0x80000000 ? 0xFFFFFFFF : 0);
|
||||||
|
ComputeCarry(i & 0x80000000 ? true : false);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
amount &= 0x1F;
|
||||||
|
gpr.SetImmediate(a, i >> amount);
|
||||||
|
ComputeCarry(amount != 0 && i < 0 && (i << (32 - amount)));
|
||||||
|
}
|
||||||
|
|
||||||
|
if (inst.Rc)
|
||||||
|
ComputeRC(gpr.GetImm(a), 0);
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
else if (gpr.IsImm(b) && (gpr.GetImm(b) & 0x20) == 0 && !js.op->wantsCA)
|
||||||
|
{
|
||||||
|
gpr.BindToRegister(a, a == s);
|
||||||
|
ASR(gpr.R(a), gpr.R(a), gpr.GetImm(b) & 0x1F);
|
||||||
|
}
|
||||||
|
else if (!js.op->wantsCA)
|
||||||
|
{
|
||||||
|
gpr.BindToRegister(a, a == b || a == s);
|
||||||
|
|
||||||
|
ARM64Reg WA = gpr.GetReg();
|
||||||
|
|
||||||
|
LSL(EncodeRegTo64(WA), EncodeRegTo64(gpr.R(s)), 32);
|
||||||
|
ASRV(EncodeRegTo64(WA), EncodeRegTo64(WA), EncodeRegTo64(gpr.R(b)));
|
||||||
|
LSR(EncodeRegTo64(gpr.R(a)), EncodeRegTo64(WA), 32);
|
||||||
|
|
||||||
|
gpr.Unlock(WA);
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
gpr.BindToRegister(a, a == b || a == s);
|
||||||
|
ARM64Reg WA = gpr.GetReg();
|
||||||
|
ARM64Reg WB = gpr.GetReg();
|
||||||
|
ARM64Reg WC = gpr.GetReg();
|
||||||
|
|
||||||
|
ANDI2R(WA, gpr.R(b), 32);
|
||||||
|
FixupBranch bit_is_not_zero = TBNZ(gpr.R(b), 5);
|
||||||
|
|
||||||
|
ANDSI2R(WC, gpr.R(b), 31);
|
||||||
|
MOV(WB, gpr.R(s));
|
||||||
|
FixupBranch is_zero = B(CC_EQ);
|
||||||
|
|
||||||
|
ASRV(WB, gpr.R(s), WC);
|
||||||
|
FixupBranch bit_is_zero = TBZ(gpr.R(s), 31);
|
||||||
|
|
||||||
|
MOVI2R(WA, 32);
|
||||||
|
SUB(WC, WA, WC);
|
||||||
|
LSL(WC, gpr.R(s), WC);
|
||||||
|
CMP(WC, 0);
|
||||||
|
CSET(WA, CC_NEQ);
|
||||||
|
FixupBranch end = B();
|
||||||
|
|
||||||
|
SetJumpTarget(bit_is_not_zero);
|
||||||
|
CMP(gpr.R(s), 0);
|
||||||
|
CSET(WA, CC_LT);
|
||||||
|
CSINV(WB, WZR, WZR, CC_GE);
|
||||||
|
|
||||||
|
SetJumpTarget(is_zero);
|
||||||
|
SetJumpTarget(bit_is_zero);
|
||||||
|
SetJumpTarget(end);
|
||||||
|
|
||||||
|
MOV(gpr.R(a), WB);
|
||||||
|
STRB(INDEX_UNSIGNED, WA, PPC_REG, PPCSTATE_OFF(xer_ca));
|
||||||
|
|
||||||
|
gpr.Unlock(WA, WB, WC);
|
||||||
|
}
|
||||||
|
|
||||||
|
if (inst.Rc)
|
||||||
|
ComputeRC(gpr.R(a), 0);
|
||||||
|
}
|
||||||
|
|
||||||
void JitArm64::rlwimix(UGeckoInstruction inst)
|
void JitArm64::rlwimix(UGeckoInstruction inst)
|
||||||
{
|
{
|
||||||
INSTRUCTION_START
|
INSTRUCTION_START
|
||||||
|
@ -84,6 +84,36 @@ void JitArm64::mcrf(UGeckoInstruction inst)
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
void JitArm64::mcrxr(UGeckoInstruction inst)
|
||||||
|
{
|
||||||
|
INSTRUCTION_START
|
||||||
|
JITDISABLE(bJITSystemRegistersOff);
|
||||||
|
|
||||||
|
ARM64Reg WA = gpr.GetReg();
|
||||||
|
ARM64Reg XA = EncodeRegTo64(WA);
|
||||||
|
ARM64Reg WB = gpr.GetReg();
|
||||||
|
ARM64Reg XB = EncodeRegTo64(WB);
|
||||||
|
|
||||||
|
// Copy XER[0-3] into CR[inst.CRFD]
|
||||||
|
LDRB(INDEX_UNSIGNED, WA, PPC_REG, PPCSTATE_OFF(xer_ca));
|
||||||
|
LDRB(INDEX_UNSIGNED, WB, PPC_REG, PPCSTATE_OFF(xer_so_ov));
|
||||||
|
|
||||||
|
// [0 SO OV CA]
|
||||||
|
ADD(WA, WA, WB, ArithOption(WB, ST_LSL, 2));
|
||||||
|
// [SO OV CA 0] << 3
|
||||||
|
LSL(WA, WA, 4);
|
||||||
|
|
||||||
|
MOVP2R(XB, m_crTable);
|
||||||
|
LDR(XB, XB, XA);
|
||||||
|
STR(INDEX_UNSIGNED, XB, PPC_REG, PPCSTATE_OFF(cr_val[inst.CRFD]));
|
||||||
|
|
||||||
|
// Clear XER[0-3]
|
||||||
|
STRB(INDEX_UNSIGNED, WZR, PPC_REG, PPCSTATE_OFF(xer_ca));
|
||||||
|
STRB(INDEX_UNSIGNED, WZR, PPC_REG, PPCSTATE_OFF(xer_so_ov));
|
||||||
|
|
||||||
|
gpr.Unlock(WA, WB);
|
||||||
|
}
|
||||||
|
|
||||||
void JitArm64::mfsr(UGeckoInstruction inst)
|
void JitArm64::mfsr(UGeckoInstruction inst)
|
||||||
{
|
{
|
||||||
INSTRUCTION_START
|
INSTRUCTION_START
|
||||||
|
@ -188,8 +188,8 @@ static GekkoOPTemplate table31[] = {
|
|||||||
{746, &JitArm64::FallBackToInterpreter}, // addmeox
|
{746, &JitArm64::FallBackToInterpreter}, // addmeox
|
||||||
{202, &JitArm64::addzex}, // addzex
|
{202, &JitArm64::addzex}, // addzex
|
||||||
{714, &JitArm64::addzex}, // addzeox
|
{714, &JitArm64::addzex}, // addzeox
|
||||||
{491, &JitArm64::FallBackToInterpreter}, // divwx
|
{491, &JitArm64::divwx}, // divwx
|
||||||
{1003, &JitArm64::FallBackToInterpreter}, // divwox
|
{1003, &JitArm64::divwx}, // divwox
|
||||||
{459, &JitArm64::divwux}, // divwux
|
{459, &JitArm64::divwux}, // divwux
|
||||||
{971, &JitArm64::divwux}, // divwuox
|
{971, &JitArm64::divwux}, // divwuox
|
||||||
{75, &JitArm64::mulhwx}, // mulhwx
|
{75, &JitArm64::mulhwx}, // mulhwx
|
||||||
@ -206,8 +206,8 @@ static GekkoOPTemplate table31[] = {
|
|||||||
{648, &JitArm64::subfex}, // subfeox
|
{648, &JitArm64::subfex}, // subfeox
|
||||||
{232, &JitArm64::FallBackToInterpreter}, // subfmex
|
{232, &JitArm64::FallBackToInterpreter}, // subfmex
|
||||||
{744, &JitArm64::FallBackToInterpreter}, // subfmeox
|
{744, &JitArm64::FallBackToInterpreter}, // subfmeox
|
||||||
{200, &JitArm64::FallBackToInterpreter}, // subfzex
|
{200, &JitArm64::subfzex}, // subfzex
|
||||||
{712, &JitArm64::FallBackToInterpreter}, // subfzeox
|
{712, &JitArm64::subfzex}, // subfzeox
|
||||||
|
|
||||||
{28, &JitArm64::boolX}, // andx
|
{28, &JitArm64::boolX}, // andx
|
||||||
{60, &JitArm64::boolX}, // andcx
|
{60, &JitArm64::boolX}, // andcx
|
||||||
@ -223,7 +223,7 @@ static GekkoOPTemplate table31[] = {
|
|||||||
{922, &JitArm64::extsXx}, // extshx
|
{922, &JitArm64::extsXx}, // extshx
|
||||||
{954, &JitArm64::extsXx}, // extsbx
|
{954, &JitArm64::extsXx}, // extsbx
|
||||||
{536, &JitArm64::srwx}, // srwx
|
{536, &JitArm64::srwx}, // srwx
|
||||||
{792, &JitArm64::FallBackToInterpreter}, // srawx
|
{792, &JitArm64::srawx}, // srawx
|
||||||
{824, &JitArm64::srawix}, // srawix
|
{824, &JitArm64::srawix}, // srawix
|
||||||
{24, &JitArm64::slwx}, // slwx
|
{24, &JitArm64::slwx}, // slwx
|
||||||
|
|
||||||
@ -303,7 +303,7 @@ static GekkoOPTemplate table31[] = {
|
|||||||
{339, &JitArm64::mfspr}, // mfspr
|
{339, &JitArm64::mfspr}, // mfspr
|
||||||
{467, &JitArm64::mtspr}, // mtspr
|
{467, &JitArm64::mtspr}, // mtspr
|
||||||
{371, &JitArm64::mftb}, // mftb
|
{371, &JitArm64::mftb}, // mftb
|
||||||
{512, &JitArm64::FallBackToInterpreter}, // mcrxr
|
{512, &JitArm64::mcrxr}, // mcrxr
|
||||||
{595, &JitArm64::mfsr}, // mfsr
|
{595, &JitArm64::mfsr}, // mfsr
|
||||||
{659, &JitArm64::mfsrin}, // mfsrin
|
{659, &JitArm64::mfsrin}, // mfsrin
|
||||||
|
|
||||||
|
Reference in New Issue
Block a user